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(57) Abstract 

The invention concerns a genomic retroviral nucleic material, in isolated or purified state, at least partially functional or non-functional, 
whereof the genome comprises a reference nucleotide sequence selected from the group including sequences SEQ ID N os : 1 to 15, their 
complementary sequences, and their equivalent sequences, in particular the nucleotide sequences having, for every series of 100 contiguous 
monomers, at least 70 % and preferably at least 90 % homology with said sequences SEQ ID N os : 1 to 15. The invention also concerns 
the application of said material. 



(57) Abrege 

L'invention concerne un matenel nucteique de type genomique retroviral, a l'6tat isol6 ou purifi6, au moins partiellement fonctionnel 
ou non fonctionnel, dont le g6nome comprend une sequence nuclddotidique de reference choisie dans le groupe incluant les sequences SEQ 
ID NOs: 1 a 15, leurs sequences complementaires, et leurs s6quences equivalentes, notamment les sequences nucleotidiques prdsentant, 
pour toute suite de 100 monomeres contigus, au moins 70 % et preTerentiellement au moins 90 % d'homologie avec respectivement lesdites 
sequences SEQ ID NOs: I a 15; et les applications de ce matenel. 
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SEQUENCES RETROVIRAUX ENDOGENES, ASSOCIEES A DES MALADIES AUTO-IMMUNES 
ET/OU A DES PERTURBATIONS DE LA GROSSESSE 



5 La presente invention concerne un nouveau materiel 

nucleique, de type genomique retroviral endogene, 
differents fragments nucleotidiques qui le comprennent ou 
qui sont obtenus a partir dudit materiel, ainsi que leur 
utilisation pour marquer au moins une maladie auto-immune, 

10 ou une pathologie qui lui est associee, une grossesse 
pathologique ou un insucces de grossesse. 

Le criblage de la banque d • ADNc a l'aide de la 
sonde Ppol-MSRV (SEQ ID NO: 29) a permis de detecter des 
clones chevauchant permettant la reconstruction d'un ARN 

15 genomique putatif de 7582 nucleotides. - Par sequence 
reconstruite, on entend la sequence deduite de 
l'alignement des clones chevauchants Cet ARN genomique 

presente la structure R~U5-gag-pol-env-U3-R. Une 
interrogation "blastn" sur plusieurs bases de donnees, a 

2 0 l'aide du genome reconstruit, montre qu'il existe une 
quantite importante de sequences genomiques (ADN) 
apparentees dans le genome humain. Environ 4 00 sequences 
ont ete identifiees dans GenBank (cf figure 3) et plus de 
2 00 sequences dans la banque EST (Expressed Sequence Tag) , 

25 la plupart en antisens. Ces sequences sont trouvees sur 
plusieurs chromosomes, notamment les chromosomes 5, 7, 14, 
16, 21, 22, X, avec une forte concentration apparente de 
LTR sur le chromosome X. 

La sequence reconstruite (ARNm) est contenue 

30 integralement . a l^nterieur du clone genomique RG083M05 
(gb AC00064) (9,6 kb) , et presente une similitude de 96% 
avec deux regions discontinues de ce clone qui contient 
egalement des regions repetees a chaque extremite. 
L'alignement des sequences experimentales correspondant 

35 aux regions 5' et 3 1 de 1 'ARN genomique reconstruit avec 
1 ' ADN du clone RG083M05 a permis de deduire une sequence 
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LTR et d' identifier des elements caracteristiques des 
retrovirus notamment ceux impliques dans la transcription 
inverse, a savoir le PBS (Primer Binding Site) en aval du 
LTR 5 ' et le PPT (PolyPurine Tract) en amont du LTR 3'. On 
5 observe que 1* element U3 est extremement court en 
comparaison de celui observe chez les retrovirus de type C 
des mammiferes, et comparable en taille a la region U3 
generalement decrite chez les retrovirus de type D et les 
retrovirus aviaires. La region PBS est homologue au PBS 

10 des retrovirus aviaires, suggerant 1 1 utilisation du 
tRNA Tr P comme amorce pour la transcription inverse. Par 
consequent, cette nouvelle famille de HERV est nominee 
HERV-W (Human Endogenous Retrovirus) . 

L' analyse phylogenique dans la region pol a montre 

15 que la famille HERV-W est phylogeniquement liee aux 
families ERV-9 et RTVL-H, et appartient done a la famille 
des retrovirus endogenes de type I. L' analyse 
phylogenetique de la trame de lecture ouverte (ORF) de env 
montre qu*elle est plus proche des retrovirus simiens de 

20 type D et des retrovirus de la reticuloendotheliose 
aviaire que des retrovirus mammiferes de type C, suggerant 
une structure de genome chimerique C/D. 

Les arbres phylogeniques , supportes par des hautes 
valeurs de "bootstrap" montrent que les families ERV-9 et 

25 HERV-W derivent de deux vagues d' insertions independantes . 
Ainsi, le(s) element (s) actif(s) a l'origine de la famille 
HERV-W est (sont) distinct (s) de celui (ceux) 
du(des)quel(s) la famille ERV-9 derive. De plus, le PBS de 
HERV-W utilise probablement un tRNA Tr P alors que ERV-9 

30 utilise probablement un tRNA Ar 9. 

Enfin, les membres de la famille HERV-W sont 
exprimes dans le placenta, alors qu'on ne detecte pas les 
ARN ERV-9 dans ce tissu. 
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FONCTIONS BIOLOGIQUES DE HERV-W 

L ' expression de HERV-W restreinte au placenta et 
la longue trame de lecture codant potentiellement pour une 
enveloppe retrovirale autorisent a proposer des fonctions 
5 biologiques physiologiques dont 1* alteration pourrait etre 
associee a des pathologies. 

L • expression restreinte au placenta suggere que 
1' expression de genes retroviraux et/ou non retroviraux 
sous la dependance des LTR peut etre hormone-dependante • 
10 Ces genes peuvent etre adjacents, ou sous la dependance de 
LTR isoles. Une pathologie peut alors provenir d'une 
expression aberrante suite a la reactivation d'un LTR 
silencieux par divers facteurs : infection virale (par 
exemple par un membre de la faxnille des Herpesvirus) ou 
15 activation immune locale. Un polymorphisme au niveau des 
LTR pourrait aussi favoriser ces evenements. 

L' enveloppe de HERV-W pourrait jouer un role 
fusogenique, en particulier au niveau de sous-types 
cellulaires du placenta. Le peptide immunosuppresseur de 

2 0 cette enveloppe pourrait proteger le foetus contre 

l*agression du systeme immunitaire maternel. Enfin, par un 
mecanisme de saturation de recepteurs, 1' enveloppe de 
HERV-W pourrait jouer un role protecteur contre les 
infections retrovirales exogenes. L ' alteration de 

25 l'immunite cellulaire locale peut decouler d'un signal 
immunostimulateur porte par 1' enveloppe, Cet effet peut 
etre lie a une region portant une activite superantigene, 
ou a la region immunosuppressive qui deviendrait 
immunostimulatrice a la suite, soit d'un polymorphisme, 

30 soit d'un effet-dose (surexpression) . 

La verification de ces implications et la 
comprehension des consequences liees a une alteration des 
fonctions biologiques des LTR ou de 1' enveloppe 
retrovirale endogenes peut mener a 1 ' etablissement de 

3 5 methodes de diagnostic ou de suivi : 
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- d'etats de grossesse pathologique ou d'insucces 
de grossesse, 

— de maladies auto-immunes comme la sclerose en 
plaques ou la polyarthrite rhumatoide. 

5 Conformement a la presente invention, il a ete 

decouvert, a l'etat endogene, un nouveau materiel 
nucleique, explicite et decrit ci-apres, ayant 
1 ■ organisation d'un retrovirus, et susceptible d'etre 
correle a une maladie auto-immune, ou une pathologie qui 

10 lui est associee, a une grossesse pathologique ou un 
insucces de grossesse. 

Le materiel nucleique selon la presente invention, 
sous forme ARNm, represente environ 8 Kb, il est 
represents a la Figure 1 et est decrit par SEQ ID NO: 11, 

15 et est represente a la Figure 2 sous forme d'ADN 
genomique. 

Par 1' expression "de type retroviral", on entend 
la caracteristique selon laquelle le materiel nucleique 
considere comprend une ou des sequences nucleotidiques 
20 apparentees a 1 ' organisation d'un retrovirus, et/ou a ses 
sequences f onctionnelles ou codantes. 

Ce materiel nucleique de reference s 1 apparente a 
un retrovirus endogene humain, designe par 1' expression 
HERV-W. En consequence, il peut etre obtenu par toute 

2 5 technique appropriee de balayage ("screening") de toute 

banque d'ADN humain, ou d'ADNc placentaire, comme montre 
ci-apres, en particulier avec des amorces ou sondes 
nucleiques synthetisees pour s'hybrider avec tout ou 
partie de SEQ ID NO: 11. 

3 0 La presente invention concerne egalement tout 

produit nucleique ou peptidique, obtenu ou derive a partir 
du materiel nucleique de reference, selon SEQ ID NO: 11. 

Et 1' invention s ' interesse pour terminer aux 
differentes correlations pouvant etre faites entre le 
35 materiel nucl6ique precite, et/ou ses produits derives, 
avec toute maladie auto-immune et/ou une pathologie qui 
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5 

lui est associee, ainsi qu'avec des cas de grossesse 
pathologique ou d f insucces de grossesse. 

Par dite " auto- immune " , on entend notamment : 

- la sclerose en plaques 

5 - la polyarthrite rhumatoide 

- le lupus erythemateux dissemine 

- le diabete insulino-dependant 

- et/ou les pathologies qui leur sont associees. 



10 La presente invention concerne tout d'abord un 

materiel nucleique de type genomique retroviral, a 1 • etat 
isole ou purifie, au moins part iellement fonctionnel ou 
non fonctionnel • 

Ce materiel est caracterise en ce que son genome 

15 comprend une sequence nucleotidique de reference choisie 
dans le groupe incluant les sequences SEQ ID NOs: 1 a 15, 
leurs sequences complementaires , et leurs sequences 
equivalentes , notamment les sequences nucleotidiques; 
presentant, pour toute suite de 100 monomeres contigus, au. 

20 moins 50% et pref erentiellement au moins 70%, par exemple 
au moins 90% d'homologie avec respectivement lesdites 
sequences SEQ ID NOs: 1 a 15. 

Ce materiel est egalement caracterise en ce que 
son genome comprend une sequence nucleotidique de 

25 reference, codant pour tout polypeptide presentant, pour 
toute suite contiglie d'au moins 3 0 acides amines, au moins 
50%, et de preference au moins 70% d'homologie avec une 
sequence peptidique susceptible d'etre codee par au moins 
une partie f onctionnelle de la sequence nucleotidique de 

30 reference telle que definie ci-dessus. 

A titre particulier, ce materiel comprend un 
fragment nucleique insere entre deux sequences 
correspondant respectivement a la region LTR et au gene 
gag de la structure genomique retrovirale, notamment un 

35 fragment nucleique constitue par ou comprenant la sequence 
SEQ ID NO: 12. 
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L' invention concerne aussi un materiel nucleique 
de type retroviral sous-genomique, const itue par une 
sequence nucleotidique identique a SEQ ID NO: 11, avec une 
deletion tel qu 1 exemplif ie par les clones cl.PH74 

5 (SEQ ID NO: 7), cl.PH7 (SEQ ID NO: 8) et cl.PiST 

(SEQ ID NO: 9), cette deletion resultant ou non d'une 
strategie d 1 epissage . 

Le materiel nucleique precedemment defini comprend 
au moins une sequence nucleotidique f onctionnelle codant 

0 pour au moins une proteine retrovirale, et/ou au moins une 
sequence nucleotidique de regulation. 

L 1 invention concerne ensuite tout fragment 
nucleotidique d 1 au moins 100 bases, comprenant une 
sequence nucleotidique choisie dans le groupe comprenant : 

5 a) toutes les sequences nucleotidiques , partielles 

et totales d'un materiel nucleique tel que defini 
precedemment 

b) toutes les sequences nucleotidiques, partielles 
et totales d'un clone choisi dans le groupe incluant les 
0 clones : 





Cl. 6A2 


(SEQ 


ID 


NO: 


1) 




cl. 6A1 


(SEQ 


ID 


NO: 


2) 




C1.7A16 


(SEQ 


ID 


NO: 


3) 




cl.Pi22 


(SEQ 


ID 


NO: 


4) 




cl.24.4 


(SEQ 


ID 


NO: 


5) 




C1.C4C5 


(SEQ 


ID 


NO: 


6) 




C1.PH74 


(SEQ 


ID 


NO: 


7) 




C1.PH7 


(SEQ 


ID 


NO: 


8) 




cl.Pi5T 


(SEQ 


ID 


NO: 


9) 




cl. 44 . 4 


(SEQ 


ID 


NO: 


10) 




HERV-W 


(SEQ 


ID 


NO: 


ID 




C1.6A5 


(SEQ 


ID 


NO: 


12) 




cl. 7A20 


(SEQ 


ID 


NO: 


13) 




C1.7A21 


(SEQ 


ID 


NO: 


14) 




LTR 


(SEQ 


ID 


NO: 


15) 
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c) les sequences respect ivement complementaires 
aux sequences selon a) et b) 

d) les sequences respectivement equivalentes aux 
sequences selon a) a c) , notamment les sequences 

5 nucleotidiques presentant, pour toute suite de 100 
monomeres contigus, au moins 50%, et de preference au 
moins 70%, ou mieux au moins 80 %, par exemple au moins 
90% d'homologie avec les sequences a) a c) . 

L ' invention concerne aussi toute sonde nucleique 

10 de detection d'un materiel nucleique, insere ou non dans 
un acide nucleique, caracterisee en ce qu'elle est 
susceptible de s'hybrider specif iquement sur un materiel 
nucleique, tel que defini precedemment. 

Une telle sonde comprend ou non un marqueur. 

15 L 1 invention concerne aussi une amorce nucleique 

pour 1 1 amplification par polymerisation d'un ARN ou d'un 
ADN, caracterisee en ce qu'elle comprend une sequence 
nucleotidique susceptible de s'hybrider specif iquement sur 
un materiel nucleique ou un fragment nucleique, tel que 

2 0 defini precedemment. 

A titre d 1 exemple, une sonde nucleique ou amorce 
nucleique selon 1 1 invention est caracterisee en ce qu'elle 
est constitute par une sequence nucleotidique choisie dans 
le groupe incluant SEQ ID NOs: 16 a 28. 
25 L' invention concerne aussi tout ARN ou ADN, et 

notamment un vecteur de replication, comprenant un 
fragment nucleotidique, tel que defini precedemment. 

L 1 invention concerne aussi tout peptide code par 
tout cadre de lecture ouvert appartenant a un fragment 

3 0 nucleotidique, tel que defini precedemment, notamment 

polypeptide, par exemple oligopeptide formant un 
determinant antigenique reconnu par des sera de patients 
affectes par une maladie auto- immune, ou une pathologie 
qui lui est associee, ou de patientes ayant une grossesse 
3 5 pathologique ou un insucces de grossesse. 
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A titre d'exemple, ce polypeptide est code par un 
fragment nucleotidique comprenant un cadre de lecture 
ouvert codant pour une ou des proteines ENV retrovirales . 
Enf in, 1 • invention concerne : 
5 - 1 ' utilisation d'un materiel nucleique, ou d 1 un 

fragment nucleotidique, ou d'un peptide defini ci-dessus, 
tels que definis precedemment , corome marqueur moleculaire 
d'une maladie auto-immune ou d'une pathologie qui lui est 
associee, de grossesse pathologique ou d' insucces de 
10 grossesse ; 

- 1 'utilisation d'un materiel nucleique, ou d'un 
fragment nucleotidique, tels que definis precedemment, 
comme marqueur chromosomique d'une susceptibilite a une 
maladie auto-immune ou d'une pathologie qui lui est 

15 associee, ou d'un risque d'une grossesse pathologique ou 
d'un insucces de grossesse ; 

- 1 ' utilisation d'un materiel nucleique, ou d'un 
fragment nucleotidique, tels que definis precedemment, 
comme marqueur de proximite d'un gene de susceptibilite a 

20 une maladie auto-immune ou a une pathologie qui lui est 
associee, ou a un risque d'une grossesse pathologique ou 
d'un insucces de grossesse. 

L' invention concerne aussi un procede de marquage 
moleculaire d'une maladie auto-immune ou d'une pathologie 

25 qui lui est associee, de grossesse pathologique ou 
d' insucces de grossesse, caracterise en ce qu'on identifie 
et/ou quantifie dans tout materiel biologique corporel, 
notamment fluide corporel, tout fragment nucleotidique, 
tel que defini precedemment, soit sous forme d'ARN, soit 

3 0 sous forme d'ADN, 

A titre d'exemple, selon un tel procede, on 
detecte dans ledit materiel biologique corporel, des 
cellules exprimant un fragment nucleotidique, tel que 
def ini precedemment . 

35 L' invention concerne une application diagnostique 

et/ou therapeutique d'un materiel nucleique, d'un fragment 
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nucleotidique ou d*un peptide defini ci-dessus, et en 
cela, un autre objet de 1 1 invention est une composition 
diagnostique ou une composition therapeutique comprenant 
undit materiel, undit fragment ou undit peptide. 

5 

Avant de detainer 1' invention, differents termes 
utilises dans la description et les revendications sont a 
present definis: 

- par virus humain, on entend un virus susceptible 
10 d'infecter ou d'etre heberge par 1 1 etre humain, 

- compte tenu de toutes les variations et/ou 
recombinaisons naturelles ou induites, pouvant etre 
rencontrees dans la pratique de la presente invention, les 
objets de cette derniere, definis ci-dessus et dans les 

15 revendications, ont ete exprimes en comprenant les 
equivalents ou derives des differents materiels 
biologiques definis ci-apres, notamment les sequences 
homologues nucleotidiques ou peptidiques, 

- le variant d'un virus ou d'un agent pathogene 
20 et/ou infectant selon 1' invention comprend au moins un 

antigene reconnu par au moins un anticorps dirige contre 
au moins un antigene correspondant dudit virus et/ou dudit 
agent pathogene et/ou infectant, et/ou un genome dont 
toute partie est detectee par au moins une sonde 

25 d 1 hybridation, et/ou au moins une amorce d 1 amplification 
nucleotidique specifique dudit virus et/ou agent pathogene 
et/ou infectant, notamment un genome appartenant a la 
famille HERV-W, dans des conditions d 1 hybridation 
determinees bien connues de l'homme de l'art, 

30 - selon I 1 invention, un fragment nucleotidique ou 

un oligonucleotide ou un polynucleotide est un 
enchainement de monomeres, ou un biopolymere , caracterise 
par la sequence, inf ormationnelle ou non, des acides 
nucleiques naturels, susceptible de s'hybrider a tout 

3 5 autre fragment nucleotidique dans des conditions 
predetermines, 1 ' enchainement pouvant contenir des 
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monomeres de structures chimiques differentes et etre 
obtenu a partir d'une molecule d'acide nucleique naturelle 
et/ou par recombinaison genetique et/ou par synthese 
chimique ; un fragment nucleotidique peut etre identique a 
5 un fragment genomique d'un element de la famille HERV-W 
considere par la presente invention, notamment un gene de 
ce dernier, par exemple pol ou env dans le cas dudit 
element ; 

- ainsi un monomere peut etre un nucleotide 
10 naturel d'acide nucleique, dont les elements constitutifs 

sont un sucre, un groupement phosphate et une base azotee; 
dans l'ARN le sucre est le ribose, dans 1 1 ADN le sucre est 
le desoxy-2-ribose ; selon qu'il s'agit de l'ADN ou l'ARN, 
la base azotee est choisie parmi 1' adenine, la guanine, 

15 l'uracile, la cytosine, la thymine; ou le nucleotide peut 
etre modifie dans l'un au moins des trois elements 
constitutifs ; a titre d' exemple, la modification peut 
intervenir au niveau des bases, generant des bases 
modifiees telles que I'inosine, la methyl-5- 

20 desoxycytidine, la desoxyuridine , la 

dimethylamino-5-desoxyuridine, la diamino-2 , 6-purine, la 
bromo-5-desoxyuridine et toute autre base modifiee 
favor isant 1 'hybridation; au niveau du sucre, la 
modification peut consister dans le remplacement d'au 

25 moins un desoxyribose par un polyamide, et au niveau du 
groupement phosphate, la modification peut consister dans 
son remplacement par des esters, notamment choisis parmi 
les esters de diphosphate, d'alkyl et arylphosphonate et 
de phosphorothioate , 

30 - par "f onctionnel" , on entend la caracteristique 

selon laquelle une sequence nucleotidique, un materiel 
nucleique, ou un fragment nucleotidique comprend une "une 
sequence inf ormationnelle" , 

- par "sequence inf ormationnelle" , on entend toute 
35 suite ordonnee de monomeres, dont la nature chimique et 

1 ' ordre dans un sens de reference, constituent ou non une 
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information f onct ionnelle de meme qualite que celle des 
acides nucleiques naturels, par exemple une trame de 
lecture. codant pour une proteine, une sequence 
regulatrice, un site d'epissage, un site de recombinaison . 
5 - par hybridation, on entend le processus au cours 

duquel, dans des conditions operatoires appropriees, 
notamment de stringence, deux fragments nucleotidiques , 
ayant des sequences suffisamment complementaires , 
s'apparient pour former une structure complexe, notamment 
10 double ou triple, de preference sous forme d'helice, 

- une sonde comprend un fragment nucleotidique 
synthetise notamment par voie chimique ou polymerisation, 
ou obtenu par digestion ou coupure enzymatique d'un 
fragment nucleotidique plus long, comprenant au moins six 

15 monomeres, avantageusement de 10 a 100 monomeres, de 
preference 10 a 30 monomeres, et possedant une specif icite 
d 1 hybridation dans des conditions determinees ; de 
preference, une sonde possedant moins de 10 monomeres 
n'est pas utilisee seule, mais 1 1 est en presence d'autres 

20 sondes de taille aussi courte ou non ; dans certaines 
conditions particulieres , il peut etre utile d'utiliser 
des sondes de taille superieure a 100 monomeres ; une 
sonde peut notamment etre utilisee a des fins de 
diagnostic et il s'agira par exemple de sondes de capture 

25 et/ou de detection, 

- la sonde de capture peut etre immobilisee sur un 
support solide par tout moyen approprie, c'est-a-dire 
directement ou indirectement , par exemple par covalence ou 
adsorption passive, 

30 - la sonde de detection peut etre marquee au moyen 

d'un marqueur choisi notamment parmi les isotopes 
radioactifs, des enzymes notamment choisis parmi la 
peroxydase et la phosphatase alcaline et ceux susceptibles 
d'hydrolyser un substrat chromogene, fluorigene ou 

35 luminescent, des composes chimiques chromophores, des 
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composes chromogenes, fluorigenes ou luminescents, des 
analogues de bases nucleotidiques, et la biotine, 

- les sondes utilisees a des fins de diagnostic de 
1' invention peuvent etre mises en oeuvre dans toutes les 

5 techniques d • hybridation connues de 1 1 homme de l'art, et 
notamment les techniques dites "DOT-BLOT", "SOUTHERN 
BLOT", "NORTHERN BLOT" qui est une technique identique a 
la technique "SOUTHERN BLOT" mais qui utilise de l'ARN 
comme cible, la technique SANDWICH; avantageusement , on 

10 utilise la technique SANDWICH dans la presente invention, 
comprenant une sonde de capture specif ique et/ou une sonde 
de detection specif ique, etant entendu que la sonde de 
capture et la sonde de detection doivent presenter une 
sequence nucleotidique au moins partiellement differente, 

15 - toute sonde selon la presente invention peut 

s'hybrider in vivo ou in vitro sur l'ARN et/ou sur 1 1 ADN , 
pour bloquer les phenomenes de replication, notamment 
traduction et/ou transcription, et/ou pour degrader ledit 
ADN et/ou ARN, 

20 - une amorce est une sonde comprenant au moins six 

monomeres, et avantageusement de 10 a 3 0 monomeres, 
possedant une specif icite d 1 hybridation dans des 
conditions determinees, pour 1 1 initiation d'une 
polymerisation enzymatique, par exemple dans une technique 

25 d 1 amplification telle que la PCR (Polymerase Chain 
Reaction), dans un procede d 1 elongation, tel que le 
sequengage, dans une methode de transcription inverse ou 
analogue, 

- deux sequences nucleotidiques ou peptidiques 
30 sont dites equivalentes ou derivees l'une par rapport a 

1' autre, ou par rapport a une sequence de reference, si 
fonctionnellement les biopolymeres correspondants peuvent 
jouer sensiblement le meme role, sans etre identiques, 
vis-a-vis de 1 ' application ou utilisation consideree, ou 
3 5 dans la technique dans laquelle elles interviennent ; sont 
notamment equivalentes deux sequences obtenues du fait de 
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la variability naturelle au sein d'un meme individu, bu de 
la diversity naturelle d'un individu a un autre au sein 
d'une meme espece, notamment mutation spontanee de 
1' espece a partir de laquelle elles ont ete identifiees, 
5 ou induite, ainsi que deux sequences homologues, 
l'homologie etant definie ci-apres, 

- par 11 variability" , on entend toute modification, 
spontanee ou induite d'une sequence, notamment par 
substitution, et/ou insertion, et/ou deletion de 

10 nucleotides et/ou de fragments nucleotidiques, et/ou 
extension et/ou raccourcissement de la sequence a 1 1 une au 
moins des extremites; une variability non naturelle peut 
resulter des techniques de genie genetique utilisees, par 
exemple du choix des amorces de synthese, degenerees ou 

15 non, retenues pour amplifier un acide nucleique; cette 
variability peut se traduire par des modifications de 
toute sequence de depart, consideree comme reference, et 
pouvant etre exprimees par un degre d'homologie par 
rapport a ladite sequence de reference, 

20 - l'homologie caracterise le degre d'identite de 

deux fragments nucleotidiques ou peptidiques compares ; 
elle se mesure par le pourcentage d'identite qui est 
notamment determine par comparaison directe de sequences 
nucleoditiques ou peptidiques, par rapport a des sequences 

25 nucleotidiques ou peptidiques de reference, 

- ce pourcentage d'identite a ete specif iquement 
determine pour les fragments nucleotidiques , notamment 
clones relevant de la presente invention, et provenant 
d'un meme individu; a titre d' exemple non limitatif, le 

30 plus faible pourcentage d'identite observe entre les 
differents clones d'un meme individu (cf SEQ ID NOs: 13 et 
14) est d'au moins 90% et le plus faible pourcentage 
d'identite observe entre les differents clones de deux 
individus est d'au moins 80%, 

35 - tout fragment nucleotidique est dit equivalent 

ou derive d'un fragment de reference, s'il presente une 
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sequence nucleotidique equivalente a la sequence du 
fragment de reference ; selon la definition precedente, 
sont notamment equivalents a un fragment nucleotidique de 
reference : 

5 (a) tout fragment susceptible de s'hybrider au 

moins partiellement avec le complement du fragment de 
reference, 

(b) tout fragment dont l'alignement avec le 
fragment de reference conduit a mettre en evidence des 

10 bases contigiies identiques, en nombre plus important 
qu 1 avec tout autre fragment provenant d'un autre groupe 
taxonomique , 

(c) tout fragment resultant ou pouvant resulter de 
la variability naturelle au sein d'un meme individu, et de 

15 la diversite naturelle d'un individu a un autre dans la 
meme espece, a partir desquels il est obtenu, 

(d) tout fragment pouvant resulter des techniques 
de genie genetique appliquees au fragment de reference, 

(e) tout fragment, comportant au moins huit 

2 0 nucleotides contigus, codant pour un peptide homologue ou 

identique au peptide code par le fragment de reference, 

(f) tout fragment different du fragment de 
reference, par insertion, deletion, substitution d'au 
moins un monomere, extension, ou raccourcissement a I'une 

25 au moins de ses extremites ; par exemple, tout fragment 
corresporidant au fragment de reference, flanque a l'une au 
moins de ses extremites par une sequence nucleotidique ne 
codant pas pour un polypeptide, 

- par sequence nucleotidique, partielle ou totale, 

3 0 d'un materiel nucleique de reference, on entend egalement 

toute sequence associee par co-encapsidation, ou par 
coexpression, ou recombinee avec ledit materiel nucleique 
de reference, 

- par polypeptide, on entend notamment tout 
3 5 peptide d'au moins deux acides amines, notamment 

oligopeptide, proteine, extrait, separe, ou 
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substantiellement isole ou synthetise, par 1 1 intervention 
de la main de l'homrae, notamment ceux obtenus par synthese 
chimique, ou par expression dans un organisme recombinant, 

- par polypeptide code de maniere partielle par un 
5 fragment nucleotidique, on entend un polypeptide 

presentant au moins trois acides amines codes par au moins 
neuf monomeres contigus compris dans ledit fragment 
nucleotidique , 

- un acide amine est dit analogue a un autre acide 
10 amine, lorsque leur caracter istiques physico-chimiques 

respectives, telles que polarite, hydrophobicite , et/ou 
basicite, et/ou acidite, et/ou neutrality, sont 
sensiblement les memes ; ainsi, une leucine est analogue a 
une isoleucine , 

15 - tout polypeptide est dit equivalent ou derive 

d'un polypeptide de reference, si les polypeptides 
compares ont sensiblement les memes proprietes, et 
notamment les memes proprietes antigeniques , 

immunologiques, enzymologiques et/ou de reconnaissance 

20 moleculaire ; est notamment equivalent a un polypeptide de 
reference : 

(a) tout polypeptide possedant une sequence dont 
au moins un acide amine a ete substitue par un acide amine 
analogue, 

2 5 (b) tout polypeptide ayant une sequence peptidique 

equivalente, obtenue par variation naturelle ou induite 
dudit polypeptide de reference, et/ou du fragment 
nucleotidique codant pour ledit polypeptide, 

(c) un mimotope dudit polypeptide de reference, 

3 0 (d) tout polypeptide dans la sequence duquel un ou 

plusieurs acides amines de la serie L sont remplaces par 
un acide amine de la serie D, et vice versa, 

(e) tout polypeptide dans la sequence duquel on a 
introduit une modification des chaines laterales des 
35 acides amines, telle que par exemple une acetylation des 
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fonctions amines, une carboxylation des fonctions thiol, 
une esterif ication des fonctions carboxyliques , 

(f) tout polypeptide dans la sequence duquel une 
ou des liaisons peptidiques ont ete modifiees, comme par 

5 exemple les liaisons carba, retro, inverso, retro-inverso, 
reduites, et methylene-oxy , 

(g) tout polypeptide dont au moins un antigene est 
reconnu par un anticorps dirige contre un polypeptide de 
reference, 

10 - le pourcentage d'identite caracterisant 

l'homologie de deux fragments peptidiques compares est 
selon la presente invention d 1 au moins 80% et de 
preference au moins 90%. 

15 Les expressions d 1 ordre utilisees dans la presente 

description et les revendications , telles que "premiere 
sequence nucleotidique" ne sont pas retenues pour exprimer 
un ordre particulier, mais pour definir plus clairement 
1 ■ invention* 

20 Par detection d'une substance ou agent, on entend 

ci-apres aussi bien une identification, qu 1 une 
quantification, ou une separation ou isolement de ladite 
substance ou dudit agent, 

25 L 1 invention sera mieux comprise a la lecture de la 

description detaillee qui va suivre faite en reference aux 
Figures annexees dans lesquelles : 

- la Figure 1 represente, d'une part, 
1 • organisation du materiel retroviral endogene decouvert 

30 selon la presente invention, sous la forme d'un ARNm 
genomique putatif, et, d ' autre part, la localisation des 
clones mise en oeuvre selon la presente invention, par 
rapport a cette organisation; les echelles de longueur 
sont exprimees en Kb ; les regions flanquantes (5 1 UTR et 

35 3 1 UTR) sont indiquees dans des boltes hachurees ; les 
regions repetees dans ces deux regions flanquantes sont 
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indiquees par des f leches noires ; les regions 
correspondant aux genes gag, pol, et env, sont indiques 
respectivement, en noir, blanc et gris ; le positionnement 
de la sonde Ppol-MSRV est indique ; 
5 - la Figure 2 represent e une possibility 

d' organisation genetique (ADN) , illustree par le clone 
RG083M05, et une strategie d'epissage liant a cette 
sequence, les clones experimentaux ( ARNm ) ; cette figure 
montre egalement les sites d'epissage observes par 
10 reference a 1 ' organisation retrovirale ; sur cette figure 
sont en outre indiques : 

la localisation des sondes utilisees (Pgag-LB19, 
Ppro-E, Ppol-MSRV et Penv-C15) ; 

les sites donneurs (DS1 et DS2) et accepteurs (AS1 
15 a AS3) d'epissage ; 

les sequences provenant du clone RG083M05, dans, 
les boltes en minuscules, et les sequences derivant des 
clones experimentaux placentaires (ARNm) , dans les boitesr 
en majuscule ; 

20 les ORFs putatives (ORF1, 0RF2 et ORF3) ; et 

un insert de 2 Kb present sous forme ADN mais non 
detecte sous forme ARN, represents sous forme de hachures 
verticales ♦ 

Les autres conventions utilisees dans cette figure 
25 sont les memes que celles de la Figure 1. 

- la Figure 3 donne une representation de clones 
genomiques (ADN) correspondant aux clones d'ADNc isoles ; 
sur cette figure, sont indiques : 

le pourcentage de similitude vis-a-vis de 1 f ARN 
3 0 genomique reconstruit (ARN Recons) ; 

la presence de sequences repetees a chaque 
extremite de ces genomes (repetitions) ; et 

la presence et la taille des trames de lecture 
ouverte (ORFs) . 

35 - la Figure 4 represente une analyse phylogenique 

identifiant la famille HERV-W. 
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- la figure 5 represente 1' alignement des regions 
flanquantes 5' et 3' du clone RG083M05 avec les regions 5 1 
et/ou 3 1 terminales de certains clones placentaires ; le 
tandem CAAC flanquant les LTR 3' et 5 1 est souligne 
5 doublement sous les sequences d'ADN, la sequence LTR 
consensus de 783 pb (paires de bases) est indique au bas 
de 1 ' alignement ; le PPT en amont de 1 1 extremite 5' de LTR 
et le PBS en aval de l 1 extremite 3 1 de LTR sont indiques ; 
les regions U3R et U5 sont indiquees ; les sites 

10 correspondant a la fixation du facteur de transcription 
sont soulignes et numerotes de 1 a 6 ; la region -7 3 a 284 
correspond a la sequence evaluee en "CAT assay" ; * 
correspond a des sites putatifs de "capping" ; [polyA] 
indique le signal de polyadenylation • 

15 - la Figure 6 represente une sequence putative 

d'un polypeptide d'enveloppe (ORF1) de HERV-W obtenu a 
partir de 3 clones d'ADNc placentaires differents ; le 
peptide leader (L) , la proteine de surface (SU) et la 
proteine transmembranaire (TM) sont indiquees par des 

20 fleches ; le peptide de fusion hydrophobe et la region 
carboxy transmembranaire sont soulignes par un trait 
simple et un trait double, respectivement ; la region 
d 1 immunosuppression est signalee en italiques ; les sites 
potentiels de glycosylation sont indiques par des points ; 

25 les acides amines divergents sont indiques sur la ligne 
inferieure ; la figure 6 presente egalement les trames de 
lecture ouverte correspondant a ORF2 et ORF3 tels que 
decrits a la Figure 2, et plus particulierement leurs 
homologies avec les genes de regulation retroviraux. 

30 

Le materiel nucleique precedemment explicite a ete 
decouvert et caracterise au terme du protocole 
experimental decrit ci-apres, etant entendu que ce 
protocole ne saurait limiter la portee de la presente 
35 invention et des revendications en annexe* 
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Exemple 1 

Isolement et sequengage de fragments d • ADNc 
chevauchants 

5 Les informations concernant 1 1 organisation de 

HERV-W ont ete obtenues en testant une banque d 1 ADNc 
placentaire (Clontech cat#HL50l4a) avec les sondes 
Ppol-MSRV (SEQ ID NO: 29) et Penv-C15 (SEQ ID NO: 31) (cf 
Exemple 8) , et en pratiquant ensuite une technique de 

10 "gene walking" a l'aide des nouvelles sequences obtenues. 
Les experiences ont ete mises en oeuvre en se referant aux 
preconisations du fournisseur de la banque. Des 
amplifications PCR sur ADN ont egalement ete exploitees 
pour comprendre cette organisation. 

15 Un certain nombre de clones ont ete selectionnes 

et sequences, cf Figure 1: 

- Clone cl.6A2 (SEQ ID NO: 1) : region 5' non 
traduite de HERV-W et une partie de gag 

- Clone cl.6Al ( SEQ ID NO: 2): gag et une partie 

20 de pol 

- Clone C1.7A16 (SEQ ID NO: 3): Region 3 1 de pol 

- Clone cl.Pi22 (SEQ ID NO: 4): region 3' de pol 
et debut de env 

- Clone cl.24.4 (SEQ ID NO: 5) : ARN episse 
25 comprenant une partie de la region 5' non traduite de 

HERV-W, la fin de pol et la region 5 1 de env 

- Clone cl.C4C5. (SEQ ID NO: 6) : fin de env et 
region 3 ' non traduite de HERV-W 

- Clone cl,PH74 (SEQ ID NO: 7) : ARN sous- 
3 0 genomique : region 5' non traduite de HERV-W, fin de pol, 

env, et region 3 ' non traduite de HERV-W 

- Clone cl.PH7 (SEQ ID NO: 8) : ARN multi-episse : 
region 5' non traduite de HERV-W, fin de env et region 3' 
non traduite de HERV-W. 

35 - Clone cl.PiST (SEQ ID NO: 9) : gene pol partiel 

et region U3-R 
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- Clone cl.44.4 (SEQ ID NO: 10) : region R-U5 , 
gene gag et gene pol partiel. 

A I'aide de ces clones, en procedant a des 
alignements de sequences, un modele de sequence totale de 
5 HERV-W a ete elabore, Les ARN episses ont ete mis en 
evidence ainsi que les sites potentiels donneurs et 
accepteurs d'epissage. L' ensemble de ces informations est 
montre a la Figure 2. Par etude de similitude avec des 
retrovirus existants, les entites LTR, gag, pol et env ont 
10 ete definies. 

L ' organisation genetique putative de HERV-W sous 
forme ARN est la suivante (SEQ ID NO: 11) : 
gene 1 . . 7582 

Localisation des clones sur la sequence ARN genomique 
15 reconstruite 

cl.6A2 (1321 pb) 1-1325 ; 

C1.PH74 (535+2229= 2764 pb) 72-606 et 5353- 
7582; 

cl.24.4 (491+1457= 1948 pb) ; 115-606 et 5353- 
20 6810; 

cl.44.4 (2372 pb) 115-2496 ; 

C1.PH7 (369+297= 666pb) 237-606 et 7017-7313; 
C1.6A1 (2938 pb) 586-3559.; 

cl,Pi5T (2785+566= 3351 pb) 2747-5557 et 7017- 
25 7582; 

C1.7A16 (1422 pb) 2908-4337; 

cl.Pi22 (317+1689 = 2006 pb) 3957-4273 et 
4476-6168 ; 

C1.C4C5 (1116 pb) 6467-7582 
30 5 ' LTR 1. . 120 

/note= M R of 5' LTR (extremite 5' 

incertaine" 

121. .575 

/note="U5 of 5' LTR" 
35 divers 579.. 596 

/note="PBS primer binding site pour tRNA-W" 
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divers 



divers 



10 divers 



ORF 



15 divers 



ORF 



ORF 



20 



divers 
3 1 LTR 
25 divers 



606 

/note-" jonction d'epissage (site donneur 
d'epissage ATCCAAAGTG-GTGAGTAATA et site 
accepteur d'epissage CTTTTTTCAG-ATGGGAAACG 
clone RG083M05, GenBank accession 
AC000064) " 
5353 

/note="site accepteur d'epissage pour 

I'ORFl (env) lf 

5560 

/note="site donneur d'epissage" 
5581. .7194 

/note="ORFl env 538 AA" 

/produit-="enveloppe" 

7017 

/note="site accepteur d'epissage pour ORF2 et ORF3" 

7039. .7194 

/note="ORF2 52 AA" 

7112. .7255 

/note="ORF3 48 AA" 

7244 ♦ .7254 

/note="PPT polypurine tract" 
7256. .7582 

/note-="U3-R of 3' LTR (jonction U3-R indeterminee ) 
7563. .7569 

signal de polyadenylation 



3 0 Exemple 2 : 

Identification de clones genomiques (ADN) 
correspondant aux clones d'ADN isoles 

Une interrogation "blastn" sur plusieurs bases de 
3 5 donnees, a l'aide du genome reconstruit, montre qu'il 
existe une quantite importante de sequences apparentees 
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dans le genome humain. Environ 4 00 sequences ont ete 
identifiees dans GenBank et plus de 200 sequences dans la 
banque EST, la plupart en anti-sens . Les 4 sequences les 
plus signif icatives en taille et en similitude, illustrees 
5 sur la figure 3, sont les clones genomiques (ADN) 
suivants : 

le clone humain RG083M05 (gb AC000064) dont la 
localisation chromosomique est 7q21-7q22, 

le clone humain BAC378 (gb U85196, gb AE000660) 
10 correspondant au locus alpha delta du recepteur des 
cellules T, localise en 14qll-12, 

le cosmide humain Q11M15 (gb AF045450) 
correspondant a la region 21q2 2.3 du chromosome 21, 

le cosmide U134E6 (embl Z83850) sur le chromosome 

15 Xq22. 

La localisation des regions alignees pour chacun 
des clones est indiquee et 1 1 appartenance a un chromosome 
est indiquee entre crochets. Le pourcentage de similitude 
(sans les larges deletions) entre les 4 sequences et I'ARN 

20 genomique reconstruit est indique, ainsi que la presence 
de sequences repetees a chaque extremite du genome et la 
taille des plus grandes trames de lecture (ORF) . Des 
sequences repetees sont trouvees aux extremites de 3 de 
ces clones. La sequence reconstruite est contenue 

25 integralement a l 1 inter ieur du clone RG083M05 (9,6 Kb) et 
presente une similitude de 96%. Cependant le clone 
RG083M05 presente une insertion de 2 Kb situee 
immediatement en aval ( de la region 5 1 non traduite (5' 
UTR) . Cette insertion est egalement trouvee dans deux 

3 0 autres clones genomiques qui presentent une deletion de 
2,3 Kb immediatement en amont de la region 3' non traduite 
(3' UTR). Aucun clone ne contient les trois trames de 
lecture (ORFs) gag, pol et env f onctionnelles . Le clone 
RG083M05 montre une ORF de 538 acides amines (AA) 

3 5 correspondant a une enveloppe entiere. Le cosmide Q11M15 
contient deux grandes ORFs contigiies de 413 AA (trame 0) 
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et 305 AA (trarae +1) correspondant a une polyproteine pol 
tronquee. 

Exemple 3 
5 Analyse phylogenique 

Une analyse phylogenique a ete realisee au niveau 
des acides nucleiques sur 11 sous-regions differentes de 
1 1 ARN genomique reconstruit, et au niveau proteique sur 2 

10 sous-regions differentes de env. Tous les arbres obtenus 
presentent la meme topologie quelle que soit la region 
etudiee. Ceci est illustre a la Figure 4 au niveau des 
acides nucleiques dans les regions LTR et pol les plus 
conservees entre les sequences obtenues et ERV-9 et RTLV- 

15 H, Les arbres montrent clairement que les sequences 
experimentales decrivent une nouvelle famille distincte de 
ERV-9 et tres distincte de RTLV-H comme souligne par 
1' analyse en "bootstrap". Ces sequences sont trouvees sur 
plusieurs chromosomes, notamment les chromosomes 5, 7, 14, 

20 16, 21, 22, et X avec une forte concentration apparente de 
LTR sur le chromosome X, 

La comparaison au niveau proteique entre les 
regions les plus conservees des proteines retrovirales env 
montre que la famille HERV-W est plus proche des 

25 retrovirus simiens de type D et des retrovirus de la 
reticuloendotheliose aviaire que les retrovirus mammiferes 
de type C . 

Ceci suggere une structure genomique chimere C/D. 

30 

Exemple 4 

Identification des elements LTR/ PPT et PBS 

La sequence reconstruite (ARN) est contenue 
35 integralement a l'interieur du clone genomique RG083M05 
(9,6 Kb) et presente une similitude de 96 % avec deux 
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regions discontinues de ce clone qui contient egalement 
des regions repetees a chaque extremite. L 1 alignement des 
sequences experimentales correspondant aux regions 5' et 
3 1 de 1 * ARN genomique reconstruit avec l'ADN du clone 
5 RG083M05 [ 5 1 ( 5-RG-28000-28872 ) et 3 • ( 3 -RG-3 7500-3 8 3 14 ) ] a 
permis de deduire une sequence LTR et d 1 identifier des 
elements caracterist iques des retrovirus, notamment ceux 
impliques dans la transcription inverse, a savoir PBS en 
aval du LTR 5 1 et le PPT en amont du LTR 3* (cf Figure 5). 

10 On remarque que I 1 element U3 est extremement court en 
comparaison de celui observe chez les retrovirus de type C 
des mammiferes, et est comparable en taille a la region U3 
generalement decrite chez les retrovirus de type D et les 
retrovirus aviaire. La region correspondant aux bases 2364 

15 a 2720 du clone cl.PH74 (SEQ ID NO: 7) a ete amplifiee par 
PCR et sous-clonee dans le vecteur pCAT3 (Promega) afin de 
realiser l 1 evaluation de l'activite promotrice. Une 
activite significative a ete trouvee dans des cellules 
HeLa par la methode dite du "CAT assay" montrant la 

20 f onctionnalite de la sequence promotrice du LTR. 

La region PBS est homologue au PBS des retrovirus 

aviaires. 

2 5 Exemple 5 

Organisation genetique et regulation de 
1 • expression 

Organisation sous forme ADN 

30 Des amplifications PCR ont ete realisees sur des 

clones HERV-W entiers recuperes sur banque genomique 
humaine (voir exemple 1 pour le mode d 1 obtent ion) , en 
utilisant les couples d ' oligonucleotides suivants : 
U5 4992 (SEQ ID NO: 16) , GAG 4619 (SEQ ID NO: 17) 

35 GAG 4782 (SEQ ID NO: 18), POL 3167 (SEQ ID NO: 19) 
POL 3390 (SEQ ID NO: 20) , POL 5144 (SEQ ID NO: 21) 
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POL 5145 (SEQ ID NO: 22), U5 4991 (SEQ ID NO: 23). 

Les PCR sont realisees dans les conditions 
suivantes : 

Oligonucleotides a la concentration de 0,33 
5 microMolaire 

Tampon TAQ polymerase Boerhinger IX 

0,5 unite de TAQ polymerase Boerhinger 

Melange de dNTP a 0,25 mM chacun 

0,5 mg d'ADN humain 
10 Volume final 100 ml 

Conditions de PCR (95°C, 5 min) x 1, (95°C, 30 sec 
+ 54°C, 30 sec + 72°C 3 min) x 35. 

Les produits de PCR ont ensuite ete deposes sur 
gel d 1 agarose 1% pour etre analyses apres migration. 
15 L' ensemble des PCR donne des fragments d • amplif ication de 
taille attendue, excepte pour la PCR LTR-4991 — gag-4619 
qui donne un fragment de taille super ieure d' environ 2 Kb 
par rapport a la taille attendue (deduite a partir des 
cDNA de la banque placentaire) . La reconstitut ion de 

2 0 HERV-W sous forme ADN endogene represente done une entite 

d' environ 10 Kb. 

Apres clonage, sequen<?age et analyse de la PCR- 

4992 gag-4619, on constate la presence d'une region 

d 1 insertion entre LTR et gag de SEQ ID NO: 12 (clone 
25 cl.6A5). Cette region ne correspond pas a une region 

traditionnelle non traduite d'un retrovirus : pas de 

region ¥ ni de PBS. 

Les produits de PCR pol-3390, pol-5144 ont ete 

egalement clones et deux des clones obtenus ont ete 
30 sequences. Le resultat de ces sequences est donne par les 

clones C1.7A20 (SEQ ID NO: 13) et cl.7A21 (SEQ ID NO: 14). 

La comparaison de ces deux sequences nucleotidiques donne 

un score de 90% d'homologie pour la region concernee, 

montrant ainsi la variability de HERV-W chez un meme 

3 5 individu. 

HERV-W sous forme ADN est propose la Figure 2 . 
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Organisation generale : processus de transcription 
Les differents clones ADNc etant obtenus, des 
resultats acquis en PCR sur ADN, on deduit : 
5 - une organisation ADN de 10 Kb possedant une 

sequence d' insertion de 2 Kb entre LTR et gag. 

Le resultat de PCR sur ADN montrant la presence 
d'un insert de 2 Kb entre les regions LTR et gag suggere 
que les ADNc isoles dans le placenta proviennent de 
10 1' expression d'un genome de type RG083M05. 

- une organisation ARN de 8 Kb resultant d'une 
transcription de 10 Kb suivie d'un epissage entre LTR et 
gag permettant de restaurer une continuity RF (Region 
Flanquante) 5' gag, et donnant ainsi un ARN de 8 Kb tel 
15 que mis en evidence en Northern Blot. 

Les sondes gag (Pgag-LB19, SEQ ID NO: 30) et 
protease (Ppro-E, SEQ ID NO: 32) revelent un ARN de taille 
voisine a 8 Kb, la sonde Penv-C15 (SEQ ID NO: 31) revele 
en plus un ARN voisin de 3,1 Kb. Deux sondes definies dans 
20 la region 5' non traduite, obtenues par le criblage de la 
banque cDNA relate ci-dessus (sonde P5 ' -gag-cl . 6A2 derivee 
du clone cl.6A2 et sonde P5 1 -env-cl . 24 . 4 derivee du clone 
cl.24.4) revelent les deux precedents ARN et un ARN 
d 1 environ 1,3 Kb. Cette distribution des ARNs est typique 
25 de transcrits de retrovirus complexes : un ARN genomique 
codant pour gag-pro-pol, un ARN sous-genomique codant pour 
I'enveloppe, et un/des ARN multi-episse (s) codant 
potentiellement pour des genes de regulation. 

La demie vie d'un tel ARN (LTR— R-U5 -Insert ion-GAG- 
3 0 POL-ENV-U3 -R-HERV-W) est vraisemblablement tres courte, 
car aucun ARN de 10 Kb n ' est detecte en Northern Blot. Par 
analyse et comparaison de sequences, les sites potentiels 
donneurs (DS1 et DS2) et accepteurs (AS1 a AS3) d' epissage 
ont ete definis et deer its dans la Figure 2. 

35 
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Exemple 6 

Transcription dans des tissus sains 

Differents tissus humains sains ont ete testes par 
5 une technique de Northern Blot (Human Multiple Tissue 
Northern Blot, Clontech cat# 7760-1), a I'aide des sondes 
Ppol-MSRV (SEQ ID NO: 29) , Pgag-LB19 ( SEQ ID NO: 30) , 
Penv-C15 (SEQ ID NO: 31), Ppro-E (SEQ ID NO: 32), P5 1 -gag- 
cl.6A2 et P5 1 -env-cl . 24 . 4 , marquees comme decrit dans 

10 1' exemple 1. Les experiences ont ete realisees en suivant 
les recommandations des fabricants, et les 

autoradiographies ont ete exposees 5 jours. L' analyse des 
resultats revele des produits de transcription uniquement 
dans le placenta, et dans aucun des autres tissus humains 

15 testes (coeur, cerveau, poumon, foie, muscle squelettique , 
rein et pancreas) . 

Par une technique de Dot Blot ARN (Clontech : 
Human RNA Master Blot Cat# 7770-1) , et en utilisant le 
protocole experimental preconise par le fabricant, une 

20 quarantaine d 1 autres tissus, dont des tissus foetaux, ont 
ete testes : seul le placenta donne une reponse specifique 
apres hybridation avec les sondes Pgag-LB19 
(SEQ ID NO: 30) et Penv-C15 (SEQ ID NO: 31) . 

On constate qu'un signal est observe dans le rein 

25 en Dot-Blot ARN, ce qui est infirme par 1' analyse en 
Northern Blot. 

Exemple 7 

3 0 Identification d'un ARNm codant pour une enveloppe 

et les moyens de le detecter specif iquement 

Le criblage d'une banque d'ADNc placentaire a 
I'aide d'une sonde definie dans la region 5 1 non traduite 
35 a permis d'isoler un ADNc defini par une region 5 1 non 
traduite (5 1 NTR) , une jonction d'epissage, une sequence 
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codante, une region 3' non traduite (3 1 NTR) et une queue 
polyadenylee, cl,PH7 4 (SEQ ID NO: 7) • Ce clone correspond 
a un ARN episse codant pour une enveloppe. Par comparaison 
de sequences entre ce cDNA et le modele de HERV-W endogene 
5 propose selon Figure 2, on identifie une jonction 
d'epissage sur I'ARNm, jonction d'epissage mettant en 
continuity la region 5 1 NTR et le gene env, conduisant a 
1 ' elaboration d'un ARN sous genomique episse codant pour 
le gene d' enveloppe. Ces informations ont permis de 
10 definir un oligonucleotide specifique de cet ARNm, en 
choisissant une localisation situee sur le site d'epissage 
(Oligo 5307, selon SEQ ID NO: 24). 

La mise en evidence de cette region de jonction 
permet d'etablir un procede de discrimination entre ARN et 
15 ADN retroviral endogene, en utilisant dans une PCR un 
oligonucleotide defini sur cette region de jonction, 
notamment un oligonucleotide choisi dans le gene env 
(Oligo 4986, selon SEQ ID NO: 25), 

Les PCR sont realisees dans les conditions 
20 suivantes : 

Oligonucleotides a la concentration de 
0,33 microMolaire 

Tampon TAQ polymerase Boerhinger IX 
0,5 unite de TAQ polymerase Boerhinger 
25 Melange de dNTP a 0,2 5 mM chacun 

0 , 5 mg d 1 ADN huma in 
Volume final 100 ml 
Sur 10 ADN differents testes, ce type de PCR n'a 
pas permis d'obtenir de produits d • amplification . Par 
30 contre sur ADNc issu d'ARN placentaire ou de cellules 
exprimant HERV-W, cette PCR donne un produit 
d 1 amplification. Ce resultat confirme done la nature 
specif iquement ARN de ce fragment sous-genomique . 

35 
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Exemple 8 

Identification de sequences codantes, contenues 
dans un ARNm specif ique 



5 La strategie d'epissage decrite dans 1 ' exemple 5 

est compatible avec la presence de trois trames de lecture 
ORF1 (SEQ ID NO: 33), ORF2 (SEQ ID NO: 34) et ORF3 
(SEQ ID NO: 35) (cf Figure 6) . 

Le criblage d'une banque d f ADNc placentaire a 

10 permis d'isoler un ADNc (SEQ ID NO: 7, cl.PH74) defini par 
une region 5' non traduite (5* NTR) , une jonction 
d'epissage, une sequence codante, une region 3 1 non 
traduite (3' NTR) et une queue polyadeny lee . La sequence 
codante est de 538 acides amines ( SEQ ID NO: 33). Les 

15 analyses effectuees sur banques de donnees permettent de 
mettre en evidence des caracteristiques d'une enveloppe 
retrovirale complete. : debut de traduction d'une 
polyproteine d 1 enveloppe, d'un peptide leader fortement 
hydrophobe d ' environ 21 acides amines, d'une proteine de 

20 surface SU, d'une proteine transmembranaire TM. Ces deux 
entites proteiques presentent differents sites potentiels 
de glycosylation. Au sein de la proteine TM, on identifie 
une region immunosuppressive. 

22 pb et 95 pb en amont du site accepteur 

25 d'epissage, on a trouve respectivement deux codons 
d' initiation susceptibles de diriger la synthese de 52 AA 
(ORF2, SEQ ID NO: 34) et de 48 AA (ORF3, SEQ ID NO: 35). 
ORF2 consiste en une partie de l'extremite carboxy- 
terminale de env et ORF3 correspond a une traduction 

30 differente mais chevauchante . 

Aucune homologie significative n'a ete retrouvee 
par interrogation "blast" . Cependant une interrogation 
LFASTA dans une sous-banque de donnee limitee aux 
Retroviridae, ORF2 et ORF3 ont montre un pourcentage 

35 d'idendite de 35 % avec, respectivement, Rex du virus T- 
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lymphotrope humain et primate, et avec Tat du virus simien 
de 1 1 immunodef icience . 

5 Exemple 9 

Complexity de la famille HERV-W 

Le nombre de copies presentes dans le genome 
humain de chacune des sequences est evalue par une 

10 technique de Dot Blot, a l'aide des sondes Pgag-LB19 
(SEQ ID NO: 30) , Ppro-E (SEQ ID NO: 32) et Penv-C15 
(SEQ ID NO: 31) . 

Chacune des sondes est denaturee et deposee sur 
une membrane Hybond N+ a raison de 2,5, 5, 10, 25, 50, 

15 100 pg par depot, 0,5 mg d'ADN humain sont egalement 
deposes sur la meme membrane. Les membranes sont sechees 
2 heures sous vide a 80 °C. Les membranes sont ensuite 
hybridees avec la sonde deposee. Les techniques de 
marquage des sondes, d 1 hybridation et de lavage des 

2 0 membranes sont les memes que pour le Southern Blot. Apres 

autoradiographie des membranes, on constate des niveaux 
d'intensite de signal proportionnels aux depots sur 
membrane, Apres decoupage des zones d 1 hybridation, un 
comptage en scintillation est realise. Par comparaison 
25 entre la gamme de dilution de la sonde deposee sur 
membrane et le resultat obtenu avec l'ADN humain, on peut 
evaluer le nombre de copie par genome haplo'ide de chacune 
des regions couvertes par les sondes : 

- le nombre de gag endogene est evalue de 56 a 112 

3 0 copies (76) 

- le nombre de protease endogene est evalue de 166 
a 334 copies (260) 

- le nombre de env endogene est evalue inferieur a 
52 copies (13) . 

35 Le criblage de 10 6 clones d'une banque d'ADN 

placentaire humain (Clontech cat# H15014b) a permis de 
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denombrer 144 clones reconnus par la sonde Pgag-LB19, et 
64 clones reconnus par la sonde Penv-C15. 13 clones 

hybrides conjointement par les sondes Penv-C15 et 

Pgag-LB19 ont ete isoles, confirmant la presence de 

5 plusieurs copies d'un genome possedant a la fois gag et 
env, sans consideration de f onctionnalite . 



Le materiel nucleique, les sequences 

10 nucleotidiques , et les peptides ou proteines 
eventuellement expr imees par lesdits mater ie Is et 
sequences, peuvent etre utilises pour detecter, prevoir, 
traiter et suivre toute maladie auto-immune, et les 
pathologies qui lui sont associees, ainsi que des cas de 
15 grossesse pathologique ou d'insucces de grossesse. 

En ef f et , les donnees objectives et experimentales 
permettent de relier retrovirus et maladies auto-immunes 
et retrovirus et perturbations de la grossesse : 

(1) des mecanismes communs sont mis en oeuvre dans 
20 les pathologies retrovirales et dans des maladies auto- 
immunes (presence d • auto-anticorps , de complexes immuns, 
infiltration cellulaire de certains tissus, troubles 
neurologiques) . 

(2) des desordres pathologiques comparables a 
25 certaines maladies auto-immunes apparaissent lors des 

infections par les retrovirus HIV et HTLV (syndrome de 
Sjogren, lupus erythemateux dissemine, arthrite 

rhumatoide. . . ) . 

(3) une activite transcriptase inverse a ete 
30 detectee et des particules de type retroviral ont ete 

observees dans les surnageants de cultures cellulaires de 
patients atteints de sclerose en plaques (Perron et coll, 
Res. Virol, 1989; 140: 551-561 / Lancet 1991; 337: 862-863 
/ Res. Virol. 1992; 143: 337-350) ou de polyarthrite 
35 rhumatoide. 
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(4 ) des pathologies animales inf lammatoires 
chroniques ou auto-immunes sont liees aux retrovirus 
endogenes; certaines d ' entre elles sont utilisees comme 
modeles animaux de maladies humaines (diabete insulino- 

5 dependant, lupus erythemateux dissemine) . 

(5) des taux signif icatif s d'anticorps anti- 
retrovirus endogenes ont ete decrits dans le cadre de 
maladies auto-immunes, systemiques ou inf lammatoires; 
d'autres donnees dans ce sens ont ete communiquees par 

10 plusieurs auteurs au IVeme meeting europeen sur les 
retrovirus endogenes (Uppsala, octobre 1996) . D • apres 
Venables (communiques du IVeme meeting europeen sur les 
retrovirus endogenes, Uppsala, octobre 1996), on retrouve 
un taux d'anticorps anti-HERV-H signif icativement eleve 

15 pendant la grossesse mais aussi dans le cadre de divers 
desordres auto-immuns tels que le syndrome de Sjogren, le 
lupus erythemateux dissemine ou la polyarthrite 
rhumatoide, sans toutefois qu'une preuve de son 
implication directe puisse etre apportee a ce jour. 

20 L 1 implication des retrovirus dans le phenomene 

d ' auto-immunite reste compatible avec le caractere 
multif actoriel des maladies auto-immunes, systemiques ou 
inf lammatoires qui confrontent des facteurs genetiques, 
hormonaux, environnementaux et infectieux. 

25 Les particules observees dans les surnageants de 

cultures cellulaires de patients atteints de sclerose en 
plaques (Perron et coll, Res. Virol. 1989; 140: 551-561 / 
Lancet 1991; 337: 862-863 / Res. Virol. 1992; 143: 337- 
350) ou de polyarthrite rhumatoide (donnees non publiees) 

30 peuvent resulter de 1 ' expression : (i) d'un retrovirus 
endogene competent pour la replication, (ii) de plusieurs 
retrovirus endogenes defectifs cooperant par un phenomene 
de transcomplementation ou (iii) d'un retrovirus exogene. 

Toutes ces observations permettent d'utiliser et 

35 considerer les materiels biologiques precedemment decrits, 
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comme marqueur d'une maladie auto-immune ou de 
perturbations de la grossesse. 

En particulier, les techniques de marquage 
suivantes sont considerees : 
5 - balayage du genome humain avec des sondes 

d 1 hybridation a forte stringence, derivees du materiel 
nucleique precedemment deer it, 

- amplification directe d'ADN genomique par PCR, 
en utilisant des amorces specifiques pour la region 

10 consideree 

- analyse des regions flanquantes de genes 
cellulaires etrangers • 
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RE VEND I CATIONS 

1/ Materiel nucleique de type genomique 
retroviral, a 1 ' etat isole ou purifie, au moins 
partiellement fonctionnel ou non fonctionnel, dont le 
5 genome comprend une sequence nucleotidique de reference 
choisie dans le groupe incluant les sequences 
SEQ ID NOs: 1 a 15, leurs sequences complementaires , et 
leurs sequences equivalentes , notamment les sequences 
nucleotidiques presentant, pour toute suite de 100 

10 monomeres contigus, au moins 70% et pref erentiellement au 
moins 90% d'homologie avec respect ivement lesdites 
sequences SEQ ID NOs: 1 a 15. 

2/ Materiel nucleique de type genomique 
retroviral, a 1 1 etat isole ou purifie, au moins 

15 partiellement fonctionnel ou non fonctionnel, dont le 
genome comprend une sequence nucleotidique de reference, 
codant pour tout polypeptide presentant, pour toute suite 
contigue d'au moins 3 0 acides amines, au moins 80%, et de 
preference au moins 90% d'homologie avec une sequence 

20 peptidique susceptible d'etre codee par au moins une 
partie f onctionnelle de la sequence nucleotidique de 
reference selon la revendication l . 

3/ Materiel nucleique de type genomique retroviral 
selon l'une quelconque des revendications 1 et 2, 

25 comprenant un fragment nucleique insere entre deux 
sequences correspondant respectivement a la region LTR et 
au gene gag de la structure genomique retrovirale, 
notamment un fragment nucleique constitue par ou 
comprenant la sequence SEQ ID NO: 12. 

30 4/ Materiel nucleique de type retroviral sous- 

genomique, constitue par une sequence nucleotidique 
identique a SEQ ID NO: 11, avec au moins une deletion, 
telle qu'une sequence choisie parmi SEQ ID NOs: 7 a 9. 

5/ Materiel nucleique selon l'une quelconque des 

35 revendications 1 et 4, comprenant au moins une sequence 
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nucleotidique fonctionnelle codant pour au moins une 
proteine retr ovirale • 

6/ Materiel nucleique selon l'une quelconque des 
revendications 1 et 4, coraprenant au moins une sequence 
5 nucleotidique de regulation. 

7/ Fragment nucleotidique d 9 au moins 100 bases, 
comprenant une sequence nucleotidique choisie dans le 
groupe comprenant : 

a) toutes les sequences nucleotidiques, partielles 
10 et totales d'un materiel nucleique selon 1 1 une quelconque 

des revendications 1 a 6 

b) toutes les sequences nucleot idiques , partielles 
et totales d'un clone choisi dans le groupe incluant les 
clones : 



15 




cl.6A2 


(SEQ 


ID 


NO: 


1) 






cl. 6A1 


(SEQ 


ID 


NO: 


2) 






C1.7A16 


(SEQ 


ID 


NO: 


3) 






cl. Pi22 


(SEQ 


ID 


NO: 


4) 






cl.24.4 


(SEQ 


ID 


NO: 


5) 


20 




C1.C4C5 


(SEQ 


ID 


NO: 


6) 






C1.PH74 


(SEQ 


ID 


NO: 


7) 






C1.PH7 


(SEQ 


ID 


NO: 


8) 






cl.PiST 


(SEQ 


ID 


NO: 


9) 






cl. 44 . 4 


(SEQ 


ID 


NO: 


10) 


25 




HERV-W 


(SEQ 


ID 


NO: 


11) 






cl. 6A5 


(SEQ 


ID 


NO: 


12) 






C1.7A20 


(SEQ 


ID 


NO: 


13) 






cl. 7A21 


(SEQ 


ID 


NO: 


14) 






LTR 


(SEQ 


ID 


NO: 


15) 



30 c) les sequences respect ivement complementaires 

aux sequences selon a) et b) 

d) les sequences respectivement equivalentes aux 
sequences selon a) a c) , notamment les sequences 
nucleotidiques presentant, pour toute suite de 100 

3 5 monomeres contigus, au moins 50%, et de preference au 
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moins 70%, par exemple au moins 90% d'homologie avec les 
sequences a) a c) . 

8/ Sonde nucleique de detection d 1 un materiel 
nucleique, insere ou non dans un acide nucleique, 
5 caracterisee en ce qu'elle est susceptible de s'hybrider 
specif iquement sur un materiel nucleique, selon l'une 
quelconque des revendications 1 a 6, ou un fragment 
nucleique selon la revendicat ion 7. 

9/ Sonde selon la revendication 8, caracterisee en 
10 ce qu'elle comprend un marqueur. 

10/ Amorce nucleique pour 1 1 amplification par 
polymerisation d 1 un ARN ou d'un ADN, caracterisee en ce 
quelle comprend une sequence nucleotidique susceptible de 
s'hybrider specif iquement sur un materiel nucleique selon 
15 l'une quelconque des revendications 1 a 6, ou un fragment 
nucleique selon la revendication 7, 

11/ Sonde nucleique ou amorce nucleique 
caracterisee en ce qu'elle est constitute par une sequence 
nucleotidique choisie dans le groupe incluant 
20 SEQ ID NOs: 16 a 28. 

12/ ARN ou ADN, et notamment vecteur de 
replication, comprenant un fragment nucleotidique selon la 
revendication 7 . 

13/ Peptide code par tout cadre de lecture ouvert 
25 appartenant a un fragment nucleotidique selon la 
revendication 7, notamment polypeptide, par exemple 
oligopeptide formant un determinant antigenique reconnu 
par des sera de patients affectes par une maladie auto- 
immune, ou une pathologie qui lui est associee, ou par des 
30 patientes ayant une grossesse pathologique ou un insucces 
de grossesse. 

14/ Peptide selon la revendication 13, caracterise 
en ce qu'il est code par un fragment nucleotidique 
comprenant un cadre de lecture ouvert codant pour une ou 
3 5 des proteines ENV retrovirales . 
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15/ Utilisation d 1 un materiel nucleique selon les 
revendications 1 a 6, ou d ' un fragment nucleotidique selon 
la revendication 7, ou d 1 un peptide selon la revendication 
13 ou 14, comme marqueur moleculaire d'une maladie auto- 
immune ou d'une pathologie qui lui est associee, ou d'une 
grossesse pathologique ou d 1 un insucces de grossesse. 

16/ Utilisation d 1 un materiel nucleique selon les 
revendications 1 a 6, ou d 1 un fragment nucleotidique selon 
la revendication 7, comme marqueur chromosomique d'une 
susceptibilite a une maladie auto-immune ou d'une 
pathologie qui lui est associee, ou d'un risque d'une 
grossesse pathologique ou d'un insucces de grossesse. 

17/ Utilisation d'un materiel nucleique selon les 
revendications 1 a 6, ou d'un fragment nucleotidique selon 
la revendication 7, comme marqueur de proximite d'un gene 
de susceptibilite a une maladie auto-immune ou a une 
pathologie qui lui est associee, ou a un risque d'une 
grossesse pathologique ou d'un insucces de grossesse* 

18/ Procede de marquage moleculaire d'une maladie 
auto-immune ou d'une pathologie qui lui est associee, 
d'une grossesse pathologique ou d'un insucces de 
grossesse, caracterise en ce qu ' on identifie et/ou 
quantifie dans tout materiel biologique corporel, 
notamment fluide corporel, tout fragment nucleotidique 
selon la revendication 7, soit sous forme d'ARN, soit sous 
forme d'ADN. 

19/ Procede selon la revendication 18, caracterise 
en ce qu'on detecte dans ledit materiel biologique 
corporel, des cellules exprimant le fragment nucleotidique 
selon la revendication. 

2 0/ Composition diagnostique ou therapeutique 
comprenant un materiel nucleique selon les revendications 
1 a 6, ou un fragment nucleotidique selon la revendication 
7, ou un peptide selon la revendication 13 ou 14. 
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LISTAGE DE SEQUENCES 



(1) INFORMATIONS GENERALES: 

5 (i) DEPOSANT: 

(A) NOM: BIO MERIEUX 

(B) RUE: CHEMIN DE L ' ORME 

(C) VILLE: MARCY L * ETOILE 
(E) PAYS: FRANCE 

10 (F) CODE POSTAL: 69280 



(ii) TITRE DE L ' INVENTION: 
RETROVIRAL ENDOGENE , ASSOCIE A 
PERTURBATIONS DE LA GROSSESSE 

15 

(iii) NOMBRE DE SEQUENCES : 35 



MATERIEL NUCLEIQUE DE TYPE GENOMIQUE 
UNE MALADIE AUTO- IMMUNE ET/OU A DES 
; UTILISATION EN TANT QUE MARQUEUR 



(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Floppy disk 
20 (B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D * EXPLOITATION: PC-DOS /MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.30 { OEB ) 



2 5 (2) INFORMATIONS POUR LA SEQ ID NO: 1: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1321 paires de bases 

(B) TYPE: nucleotide 

30 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ARNm (en ADN) 



3 5 (iii) HYPOTHETIQUE: NON 
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2 



10 



15 



20 



25 



30 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 
CAACAATCGG GATATAAACC CAGGCATTCG AGCTGGCAAC AGCAGCCCCC CTTTGGGTCC 60 

CTTCCCTTTG TATGGGAGCT GTTTTCATGC TATTTCACTC TATTAAATCT TGCAACTGCA 120 

CTCTTCTGGT CCATGTTTCT TACGGCTCGA GCTGAGCTTT TGCTCACCGT CCACCACTGC 180 

TGTTTGCCAC CACCGCAGAC CTGCCGCTGA CTCCCATCCC TCTGGATCCT GCAGGGTGTC 240 

CGCTGTGCTC CTGATCCAGC GAAGCGCCCA TTGCCGCTCC CAATTGGGCT AAAGGCTTGC 300 

CATTGTTCCT GCACGGCTAA GTGCCTGGGT TTGTTCTAAT TGAGCTGAAC ACTAGTCACT 3 60 

GGGTTCCATG GTTCTCTTCT GTGACCCACG GCTTCTAATA GAACTATAAC ACTTACCACA 420 

TGGCCCAAGA TTCCATTCCT TGGAATCCGT GAGGCCAAGA ACTCCAGGTC AGAGAATACG 480 

AAGCTTGCCA CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT 540 

TGGGAGCTCT GTGAGCAAGG ACCCCCCGGT AACATTTTGG CAACCACGAA CGGACATCCA 600 

AAGTGATGGG AAACGTTCCC CGCAAGACAA AAACGCCCCT AAGACGTATT CTGGAAAATT 660 

GGGAACAATT TGACCCTCAG ACACTAAGAA AGAAACGACT TATATTCTTC TGCAGTGCCG 720 
CCTGGCACTC CTGAGGGAAG TATAAATTAT AACACCATCT TACAGCTAGA CCTCTTTTGT 7 80 
AGAAAAGGCA AATGGAGTGA AGTGCCATAA GTACAAACTT TCTTTTCATT AAGAGACAAC 840 
TCACAATTAT GTAAAAAGTG TGATTTATGC CCTACAGGAA GCCTTCAGAG TCTACCTCCC 900 
TATCCCAGCA TCCCCGACTC CTTCCCCACT TAATAAGGAC CCCCCTTCAA CCCAAATGGT 960 

CCAAAAGGAG AT AG AC AAAA GGGTAAACAG TGAACCAAAG AGTGCCAATA TTCCCCAATT 1020 
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ATGACCCCTC CAAGCAGTGG GAGGAAGAGA ATTCGGCCCA GCCAGAGTGC ATGTGCCTTT 1080 

TTCTCTCCCA GACTTAAAGC AAATAAAAAC AGACTTAGGT AAATTCTCAG ATAACCCTGA 1140 

5 

TGGCTATATT GGTGTTTTAC AAGGGTTAGG ACAATTCTTT GATCTGACAT GGAGAGATAT 1200 

ATATGTCACT GCTAAATCAG ACACTAACCC CAAATGAGAG AAGTGCCACC ATAACTGCAG 12 60 

10 CCTGAGAGTT TGGCGATCTC TGGTATCTCA GTCAGGTCAA TGATAGGATG ACAACAGAGG 1320 

A 1321 

15 (2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2938 paires de bases 

(B) TYPE: nucleotide 

2 0 <C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

2 5 (iii) HYPOTHETIQUE : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

CAACGACGGA CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA 60 

30 

CGTATTCTGG AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA 12 0 
TTCTTCTGCA GTGCCGCCTG GCACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA 180 
35 G CT AG ACT T C TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT 240 
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25 
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TTCATTAAGA GACAACTCAC AATTATGTAA AAAGTGTGAT TTATGCCCTA CAGGAAGCCT 300 

TCAGAGTCTA CCTCCCTATC CCAGCATCCC CGACTCCTTC CCCAACTAAT AAGGACCCCC 360 

CTTCAACCCA AATGGTCCAA AAGGAGATAG ACAAAAGGGT AAACAGTGAA CCAAAGAGTG 420 

CCAATATTCC CCAATTATGA CCCCTCCCAA GCAGTGGGAG GAAGAGATTC GGCCCAGCCA 480 

GAGTGCATGT GCTTTTTCTT CTCCCAGACT TAAAGCAAAT AAAAACAGAC TTAGGTAAAT 540 

TCTCAGATAA TCCTGATGGC TATATTGATG TTTTACAAGG GTTAGGACAA TTCTTTGATC 600 

TGACATGGAG AGATATAATG TCACTGCTAA ATCAGACACT AACCCCAAAT GAGAGAAGTG 660 

CCACCATAAC TGCAGCCTGA GAGTTTGGCG ATCTCTGGTA TCTCAGTCAG GTCAATGATA 7 20 

GGATGACAAC AGAGGAAAGA GATGATCCCC ACAGCCAGCA AGCAGTTCCC AGTCTASACC 780 

CTCATTGGGG ACACAGAAAT CAGTAACATG GGAGATTGGT GCTGCAGACA TTTGCTAACT 840 

TGTGTGCTAC AAGGACTAAG GAAAACTACG AAGAAAATCT ACGAATTACT CAATGATGTC 900 

CACCATAACA CAGGGGAAGG GAAGAAAATC CTACTGCCTT TCTGGAGAGA CTAAGGGAGG 960 

CATTGAGGAA GCGTGCCTCT CTGTCACCTG ACTCTTCTGA AGGCCAACTA ATCTTAAAGC 1020 

GTAAGTTTAT CACTCAGTCA GCTGCAGACA TTAGAAAAAA CTTCAAAAGT CTGCCGTAGG 1080 

CCCGGAGCAA AACTTAGAAA CCCTATTGAA CTTGGCAACY TCGGTTTTTT ATAATAGAGA 1140 

TCAGGAGGAG CAGGCGGAAC AGGACAAACG GGATTAAAAA AAAGGCCACC GCTTTAGTCA 1200 

TGACCCTCAG GCAAGTGGAC TTTGGAGGCT CTGGAAAAGG GAAAAGCTGG GCAAATTGAA 12 60 

TGCCTAATAG GGCTTGCTTC CAGTGCGGTC TACAAGGACA CTTTAAAAAA GATTGTCCAA 1320 
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GTAGAAGTAA GCCGCCCCTT CGTCCATGCC 

ACTGCCCCAG GGGACAAAGG TCTTTTGAGT 

5 AGGACTGAGG GTGCCTGGGG CAAG CGCCAT 

TATGCTTGAC CATTGAGGGC CAGGAAGGTT 

TCTTACTCTT CTGTCCCGGA CAACTGTCCT 

10 

AGACGGGCAG TCACTAGATA CTTCTCCCAG 

TTTTCACATG CTTTTCTAAT TATGCTTGAA 

15 CT AG C AAAAG CAGGGGCCAT TATACACCTG 

CCCCTGCTTG AGGAAGGAAT TAATCCTGAA 

GCAAAGAATG CCCGTCCTGT TCAAGTTAAA 

20 

AGGCAGTACC CCCTCAGACC CAAGGCCCAA 

AAAGCCCAAG GCTTAGTAAA ACCATGCATA 

2 5 GGAGGCACAG AAACCCAGTG GACAGTGGAG 

GAGGCCGTTG TCCTTTTATA CCCAGCTGTA 

CCAGAGGAAG CAGAGTGGTT TACACTCCTG 

30 

GTACATCCTG ACTCTCAATT CTTGTTTGCC 

CTCACCTGGA CTGTTTTACC CCAAGGGTTC 

3 5 TTAGCCCAAG ACTTGAGCCA ATCCTCATAC 
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5 

CCTTATTTCA AGGGAATCAC TGGAAGGCCC 13 80 



CAGAAGCCAC TAACCAGATG ATCCAGCAGC 1440 



CCCATGCCAT CACCCTCACA GAGCCCTGGG 1500 



GTCTCCTGGA CACTGGTGCG GTCTTCTTAG 15 60 



CCAGATCTGT CACTATCTGA GGGGGTCCTA 1620 



CCACTAAGTT ATGACTGGGG AGCTTTATTC 1680 



AGCCCCACTA CCTTGTTAGG GAGAGACATT 17 40 



AACATAGGAG AAGGAACACC CGTTTGTTGT 1800 



GTCTGGGCAA CAGAAGGACA ATATGGACGA 1860 



CTAAAGGATT CCACTTCCTT TCCCTACCAA 1920 
CAAGGATTCC AAAAGATTGT TAAGGACTTA 1980 



ACTCCCTGCA GTAATTCCGT AGTGGATTGA 2040 



GGTTAGTGCA AGATCTCAGG ATTATCAATG 2100 



CCTAGCCCTT ATACTGTGCT TTCCCAAATA 2160 



GACCTTAAGG ATGCCTTCTT CTGCATCCCT 2220 



TTTGAAGATA CTTCAAACCC AACATCTCAA 2280 



AGGGATAGCC CCCATCTATT TGGCCAGGCA 2340 
CTGGACACTT GTCCTTCGGT AGGTGGATGA 2400 
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TTTACTTTTG GCCGCCCATT CAGAAACCTT GTGCCATCAA GCCACCCAAG CGCTCTTCAA 2460 

TTTCCTCGCT ACCTGTGGCT ACATGGTTTC CAAACCAAAG GCTCAACTCT GCTCACAGCA 2 52 0 

5 GGTTACTTAG GGCTAAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ACACATCCAG 2 580 

CCTATACTGG CTTATCCTCA TCCCAAAACC CTAAAGCAAC TAAGGGGATT CCTTGGCGTA 2 640 

ATAGGTTTCT GCCGAAAATG GATTCCCAGG TTTGGCGAAA TAGCCAGGTC ATTAAATACA 2 700 

10 

CTAATTAAGG AAACTCAGAA AGCCAATACC CATTTAGTAA GATGGACAAC TGAAGTAGAA 2 7 60 

GTGGCTTTCC AGGCCCTAAC CCAAGCCCCA GTGTTAAGTT TGCCAACAGG GCAAGACTTT 282 0 

15 TCTTCATATG TCACAGAAAA AACAGGAATA GCTCTAGGAG TCCTTACACA GATCCGAGGG 2880 

ATGAGCTTGC AACCTGTGGC GTACCTGACT AAGGAAATTG ATGTAGTGGC AAAGGGTT 2938 

2 0 (2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 1422 paires de bases 

(B) TYPE: nucleotide 

25 (C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN ) 

3 0 (iii) HYPOTHETIQUE : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 
TCAGGGATAG CCCCCATCTA TTTGGCCAGG CATTAGCCCA AGACTTGAGT CAGTTATCAT 60 

35 

ACCTGGACAC TCTTGTCCTT CAGTATGTGG ATGATTTACT TTTAGCTGCC TGTTCAGAAA 120 
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CCTTGTGCCA TCAAGCCACC CAAGCACTCT TAAATTTCCT CGCCACCTGT GGCTACAAGG 180 

TTTCCAAAGA GAAGCTCAGC TCTGCTCACA GCAGGTTAAA TACTTAGGAC TAAGATTATC 240 

5 

CAAAGGCACC AAGGCCCTCA GTGAGGAATG TATCCAGCCT ATACTGGCTT ATCCTCATCT 300 

CAAAACCCTA AAGCAACTAA GAGAGTTCCT TGGCATAACA GGCTTCTGCC GAATATGGAT 360 

10 TCCCCAGGTA TGGCAAAATA GCCAGGCCAT TATATACAGT AATTAAGGAA ACTCAGAAAG 420 

CCAATACCCA TTTAATAAGA TGGATACCTG AAGCCAAAGT GGCTTTCCAG GCCCCTAAAG 480 

AAGGCCTTAA ACCCAAGTCC CAGTGTTAAG CTTGCCAACG GGGCAAGACT TTTCTTTATA 540 

15 

CATCACAGAA AAAAACAGAA ACAGCTCTGG GAGTCCTTAC ACAGGTCCAA GGGACGAGCT 600 

TGCAACCCAT GGCATACCTG AG T AAG G AAA CTGATGTAGT GGCAAAGGGT TGGCTTCATT 660 

2 0 GTTTATGGGT AGTGGTGGCA GTAGCAGTTG TAGTATCTGA AGCAGTTAAA ATAATACAGG 720 

GGAGAGATCT TACTGTGTGG ACATCTCATG AGGTGAACAG CATACTCACT GCTAAAGGAG 780 

ACTTGTGGCT GTCAGACAAC CGTTTACTTA AATATCAGGC TCTATTACTT GAAAGGCCAG 840 

25 

TGCTGCAACT GTGCACTTGT GCAACTCTTA ACCCAGTCNC ATTTCTTCCA GACAATGAAG 900 

ATAGAATATA ACTGTCAACA AATAATTTCT CAAACCTATG CCACTCGAGG GGACCTTCTA 960 

3 0 GAAGTTCCCT TGACTGATCC TGACCTTCAA CTTGTATACT GATGGAAGTT CCTTTGTAGA 1020 

AAAAGGACTT CAAAAGCGGG GTATGCAGTG GTCAGTGATA ATGGAATATT TGAAAGTATC 1080 

CCCTCACTCC AGGAACTAGT GCTTAGCTGG CAGAACTAAT AGCCTTCATT GGGGCACTAG 1140 

35 

AATTAGGAGA AGGAAAAAGG GTAAATATAT ATACAGACTC TGAGTATGCT CACCTAGTCN 1200 
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TCCATGCCCA TGAGGCAATA TGCAGAGAAA GGGAATTCCT AACTTCCGAG GGAACACCTA 1260 

TCACACATCA GGAAGCCATT AGGAGATTAT TACTGGCAGT ACAGAAACCT AAAGAGGTGG 1320 

5 

AAGTCTTACA CTGCTGGGGT CATCAGAAAG GAAAGAAAAG GGAAATAGAA GGGAATTGCC 1380 

AAGCAGATAT TGAAGCAAAA AGAGCTGCAA GGCAGGACCC TC 1422 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2006 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ARNm (en ADN ) 

20 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 4: 

2 5 ATGCAGTGGT CAGTGATAAT GGAATACTTG AAAGTAATCC CCTCACTCCA GGAACTAGTG 60 

CTCAGCTAGC AGAACTAATA GCCCTCACTT GGGCACTAGA ATTAGGAGAA GAAAAAAGGG 120 
CAAATATATA TACAGACTCT AAATATGCTT ACCTAGTCCT CCATGCCCAT GCAGCAATAT 180 

30 

GGAAAGAAAG GGAATTCCTA ACTTCTGAGA GAACACCTAT CAAACATCAG GAAGCCATTA 240 
GGAAATTATT ATTGGCTGTA CAGAAACCTA AAGAGGTGGC AGTCTTACAC TGCCGGGGTC 300 

3 5 ATCANAAAGG AAAGGAAAGG GAAAATACTT TTGCCTGCAA CTATCCAATG GAAATTACTT 360 
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AAAACCCTTC ATCAAACCTT TCACTTAGGC ATCGATAGCA CCCATCAAAT GGCCAAATCA 420 

TTATTTACTG GACCAGGCCT TTTCAAAACT ATCAAGCAAA TATTCAGGGC CTGTGAATTG 480 

5 TGCCAAAAAA ATAATCCCCT GCCTCATCGC CAAGCTCCTT CAGGAAAACA AAAAACAGGC 540 

CATTACCCTG AAAAAAACTG GCAACTGATT TTACCCACAA GCCCAAACCT CAGGGATTTC 600 

AGTATCTACT AGTCTGGGTA AATACTTTCA CGGGTTGGGC AAAGGCCTTC CCCTGTAGGA 660 

10 

CAGAAAAGGC CCAAGAGGTA ATAAAGGCAC TAGTTCATGA AATAATTCCC AGATTCGGAC 720 

TTCCCCGAGG CTTACAGAGT GACAATAGCC CTGCTTTCCA GGCCACAGTA ACCCAGGGAG 7 80 

15 TATCCCAGGC GTTAGGTATA CGATATCACT TACACTGCGC CTGAAGGCCA CAGTCCTCAG 840 

GGAAGGTCGA GAAAATGAAT GAAATACTCA AAGGACATCT AAAAAAGCAA ACCCAGGAAA 900 

CCCACCTCAC ATGGCCTGCT CTGTTGCCTA TAGCCTTAAA AAGAATCTGC AACTTTCCCC 9 60 

20 

AAAAAGCAGG ACTTAGCCCA TACGAAATGC TGTATGGAAG GCCCTTCATA ACCAATGACC 102 0 

TTGTGCTTGA CCCAAGACAG CCAACTTAGT TGCAGACATC ACCTCCTTAG CCAAATATCA 1080 

2 5 ACAAGTTCTT AAAACATTAC AAGGAACCTA TCCCTGAGAA GAGGGAAAAG AACTATTCCA 1140 

CCCTTGTGAC ATGGTATTAG TCAAGTCCCT TCTCTCTAAT TCCCCATCCC TAGATACATC 1200 

CTGGGAAGGA CCCTACCCAG TCATTTTATT TACCCCAACT GCGGTTAAAG TGGCTGGAGT 1260 

30 

GGTCTTGGAT ACATCACACT TGAGTCAAAT CCTGGATACT GCCAAAGGAA CCTGAAAATC 1320 

CAGGAGACAA CGCTAGCTAT TCCTGTGAAC CTCTAGAGGA TTTGCGCCTG CTCTTCAAAC 1380 

3 5 AACAACCAGG AGGAAAGTAA CTAAAATCAT AAATCCCCCA TGGCCCTCCC TTATCATATT 1440 

FEUILLE DE REMPLACEMENT (REGLE 26) 

BNSDOCID: <WO 9902696A1> 
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TTTCTCTTTA CTGTTCTTTT ACCCTCTTTC ACTCTCACTG CACCCCCTCC ATGCCGCTGT 1500 
ATGACCAGTA GCTCCCCTTA CCAAGAGTTT CTATGGAGAA TGCAGCGTCC CGGAAATATT 15 60 
5 GATGCCCCAT CGTATAGGAG TCTTTCTAAG GGAACCCCCA CCTTCACTGC CCACACCCAT 1620 
ATGCCCCGCA ACTGCTATCA CTCTGCCACT CTTTGCATGC ATGCAAATAC TCATTATTGG 1680 
ACAGGAAAAA TGATTAATCC TAGTTGTCCT GGAGGACTTG GAGTCACTGT CTGTTGGACT 17 40 

10 

TACTTCACCC AAACTGGTAT GTCTGATGGG GGTGGAGTTC AAGATCAGGC AAG AG AAAAA 1800 
CATGTAAAAG AAGTAATCTC CCAACTCACC CGGGTACATG GCACCTCTAG CCCTACAAAG 1860 
15 GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA TACTCGCCTG GTAAGCCTAT 1920 
TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA AAACCCTACT AACTGTTGGA 1980 
TATGCCTCCC CCTGAACTTC AAGCCA 2006 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 
25 (A) LONGUEUR: 1948 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 0 (ii) TYPE DE MOLECULE: ARNm (en ADN) 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 5: 

35 

ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 

FEUILLE DE REMPLACERflENT (REGLE 26) 
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CACTGCTGTT TGCCACCACC GCANACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

GCTTGCCATT GTNCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 

NTCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG GCAAGAACTC CAGGTCAGAG 360 

AAT ACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC ATCTTGGAAG TGGTTCACCA 420 

CCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CACGAACGGA 480 

CAT C C AAAG T GATACATCCT GGGAAGGACC CTACCCAGTC ATTTTATCTA CCCCAACTGC 540 

GGTTAAAGTG GCTGGAGTGG AGTCTTGGAT ACATCACACT TGAGTCAAAT CCTGGATACT 600 

GCCAAAGGAA CCTGAAAATC CAGGAGACAA CGCTAGCTAT TCCTGTGAAC CTCTAGAGGA 660 

TTTGCGCCTG CTCTTCAAAC AACAACCAGG AGGAAAGTAA CTAAAATCAT AAATCCCCAT 720 

GGCCCTCCCT TATCATATTT TTCTCTTTAC TGTTGTTTCA CCCTCTTTCA CTCTCACTGC 780 

ACCCCCTCCA TGCCGCTGTA TGACCAGTAG CTCCCCTTAC CAAGAGTTTC TATGGAGAAT 840 

GCAGCGTCCC GGAAATATTG ATGCCCCATC GTATAGGAGT CTTTGTAAGG GAACCCCCAC 900 

CTTCACTGCC CACACCCATA TGCCCCGCAA CTGCTATCAC TCTGCCACTC TTTGCATGCA 960 

TGCAAATACT CATTATTGGA CAGGAAAAAT GATTAATCCT AGTTGTCCTG GAGGACTTGG 1020 

AGTCACTGTC TGTTGGACTT ACTTCACCCA AACTGGTATG TCTGATGGGG GTGGAGTTCA 1080 

AGATCAGGCA AGAGAAAAAC ATGTAAAAGA AGTAATCTCC CAACTCACCC GGGTACATGG 1140 

FEUILLE DE RERflPLACEMENT (REGLE 26) 
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CACCTCTAGC CCCTACAAAG GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA 1200 
TACTCGCCTG GTAAGCCTAT TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA 12 60 

5 

AAACCCTACT AACTGTTGGA TATGCCTCCC CCTGAACTTC AGGCCATATG TTTCAATCCC 1320 
TGTACCTGAA CAATGGAACA ACTTCAGCAC AGAAATAAAC ACCACTTCCG TTTTAGTAGG 1380 
10 ACCTCTTGTT TCCAATCTGG AAATAACCCA TACCTCAAAC CTCACCTGTG TAAAATTTAG 1440 
CAATACTACA TACACAACCA ACTCCCAATG CATCAGGTGG GTAACTCCTC CCACACAAAT 1500 
AGTCTGCCTA CCCTCAGGAA TATTTTTTGT CTGTGGTACC TCAGCCTATC GTTGTTTGAA 1560 

15 

TGGCTCTTCA GAATCTATGT GCTTCCTCTC ATTCTTAGTG CCCCCTATGG CCATCTACAC 1620 
TGAACAAGAT TTATACAGTT ATGTCATATC TAAGCCCCGC AACAAAAGAG TACCCATTCT 1680 
2 0 TCCTTTTGTT ATAGGAGCAG GAGTGCTAGG TGCACTAGGT ACTGGCATTG GCGGTATCAC 1740 
AACCTCTACT CAGTTCTACT ACAAACTATC TCAAGAACTA AATGGGGACA TGGAACGGGT 1800 
CGCCGACTCC CTGGTCACCT TGCAAGATCA ACTTAACTCC CTAGCAGCAG TAGTCCTTCA 1860 

25 

AAATCGAAGA GCTTTAGACT TGCTAACCGC TGAAAGAGGG GGAACCTGTT TATTTTTAGG 1920 
GGAAGAATGC TGTTATTATG TTAATCAA 1948 



30 



(2) INFORMATIONS POUR LA SEQ ID NO: 6: 



35 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1136 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
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(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ARNm (en ADN) 
5 (iii) HYPOTHETIQUE : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
CCATGGCCAT CTACACTGAA CAAGATTTAT ACAGTTATGT CATATCTAAG CCCCGCAACA 60 

10 

AAAGAGTACC CATTCTTCCT TTTGTTATAG GAGCAGGAGT GCTAGGTGCA CTAGGTACTG 120 
GCATTGGCGG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAACTAAATG 180 
15 GGGACATGGA ACGGGTCGCC GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 2 40 
CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTCGCT AACCGCTGAA AGAGGGGGAA 300 
CCTGTTTATT TTTAGGGGAA GAATGCTGTT ATTATGTTAA TCAATCCGGA ATCGTCACTG 360 

20 

AGAAAGTTAA AGAAATTCGA GATCGAATAC AACGTAGAGC AGAAGAGCTT CGAAACACTG 420 
GACCCTGGGG CCTCCTCAGC CAATGGATGC CCTGGATTCT CCCCTTCTTA GGACCTCTAG 480 
25 CAGCTATAAT ATTGCTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAACTTTG 540 
TCTCTTCCAG AATCGAAGCT GTAAAACTAC AAATGGAGCC CAAGATGCAG TCCAAGACTA 600 
AGATCTACCG CAGACCCCTG GACCGGCCTG CTAGCCCACG ATCTGATGTT AATGACATCA 660 

30 

AAGGCACCCC TCCTGAGGAA ATCTCAGCTG CACAACCTCT ACTACGCCCC AATTCAGCAG 720 
GAAGCAGTTA GAGCGGTCGT CGGCCAACCT CCCCAACAGC ACTTAGGTTT TCCTGTTGAG 780 
3 5 ATGGGGGACT GAGAGACAGG ACTAGCTGGA TTTCCTAGGC TGACTAAGAA TCCCTAAGCC 840 

FEUILLE DE REMPLACEMENT (REGLE 26) 



BNSDOCID:<WO 9902696A1> 



WO 99/02696 




PCT/FR98/01442 



14 

TAGCTGGGAA GGTGACCACA TCCACCTTTA AACACGGGGC TTGCAACTTA GTTCACACCT 900 
GACCAATCAG AGAGCTCACT AAAATGCTAA TTAGGCAAAG ACAGGAGGTA AAGAAATAGC 960 
5 CAATCATCTA TTGCATGAGA GCACAGCAGG AGGGACAATG ATCGGGATAT AAACCCAAGT 1020 
CTTCGAGCCG GCAACGGCAA CCCCCTTTGG GTCCCCTCCC TTTGTATGGG AGCTCTGTTT 1080 
TCATGCTATT TCACTCTATT AAATCTTGCA GCTGCGAAAA AAAAAAAAAA AAAAAA 1136 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
15 (A) LONGUEUR: 2782 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

2 0 (ii) TYPE DE MOLECULE: ARNm (en ADN) 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 7 

25 

ATGGGAGCTG TTTTCATGCT ATTTCACTCT ATTAAATCTT GCAACTGCAC TCTTCTGGTC 60 
CATGTTTCTT ACGGCTCGAG CTGAGCTTTT GCTCACCGTC CACCACTGCT GTTTGCCACC 120 

3 0 ACCGCAGACC TGCCGCTGAC TCCCATCCCT CTGGATCCTG CAGGGTGTCC GCTGTGCTCC 180 

TGATCCAGCG AAGCGCCCAT TGCCGCTCCC AATTGGGCTA AAGGCTTGCC ATTGTTCCTG 2 40 
CACGGCTAAG TGCCTGGGTT TGTTCTAATT GAGCTGAACA CTAGTCACTG GGTTCCATGG 300 

35 

TTCTCTTCTG TGACCCACGG CTTCTAATAG AACTATAACA CTTACCACAT GGCCCAAGAT 360 

FEU1LLE DE RERflPLACEMENT (REGLE 26) 
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TCCATTCCTT GGAATCCGTG AGGCCAACGA ACTCCAGGTC AGAGAATACG AAGCTTGCCA 420 

CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT TGGGAGCTCT 480 

5 

GTGAGCAAGG ACCCCCCGGT GACATTTTGG CGACCACCAA CGGACATCCC AAGTGATACA 540 

TCCTGGGAAG GACCCTACCC AGTCATTTTA TCTACCCCAA CTGCGGTTAA AGTGGCTGGA 600 

10 GTGGAGTCTT GGATACATCA CACTTGAGTC AAATCCTGGA TACTGCCAAA GGAACCTGAA 660 

AATCCAGGAG ACAACGCTAG CTATTCCTGT GAACCTCTAG AGGATTTGCG CCTGCTCTTC 720 

AAACAACAAC CAGGAGGAAA GTAACTAAAA TCATAAATCC CCATGGGCCT CCCTTATCAT 7 80 

15 

ATTTTTCTCT GTAGTGTTCT TTCACCCTGT TTCACTCTCA CTGCACCCCC TCCATGCCGC 840 

TGTATGACCA GTAGCTCCCC TCACCCAGAG TTTCTATGGA GAATGCAGCG TCCCGGAAAT 9 00 

2 0 ATTGATGCCC CATCGTATAG GAGTCTTTCT AAGGGAACCC CCACCTTCAC TGCCCACACC 960 

CATATGCCCC GCAACTGCTA TCACTCTGCC ACTCTTTGCA TGCATGCAAA TACTCATTAT 102 0 

TGGACAGGAA AAATGATTAA TCCTAGTTGT CCTGGAGGAC TTGGAGTCAC TGTCTGTTGG 1080 

25 

ACTTACTTCA CCCAAACTGG TATGTCTGAT GGGGGTGGAG TTCAAGATCA GGCAAGAGAA 1140 

AAACATGTAA AAGAAGTAAT CTCCCAACTC ACCGGGGTAC ATGGCACCTC TAGCCCCTAC 1200 

3 0 AAAGGACTAG ATCTCTCAAA ACTACATGAA ACCCTCCGTA CCCATACTCG CCTGGTAAGC 12 60 

CTATTTAATA CCACCCTCAC TGGGCTCCAT GAGGTCTCGG CCCAAAACCC TACTAACTGT 1320 

TGGATATGCC TCCCCCTGAA CTTCAGGCCA TATGTTTCAA TCCCTGTACC TGAACAATGG 1380 

35 

AACAACTTCA G C AC AG AAA T AAACACCACT TCCGTTTTAG TAGGACCTCT TGTTTCCAAT 1440 

FEUILLE DE REPLACEMENT (REGLE 26) 
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GTGGAAATAA CCCATACCTC AAACCTCACC TGTGTAAAAT TTAGCAATAC TACATACACA 1500 
ACCAACTCCC AATGCATCAG GTGGGTAACT CCTCCCACAC AAATAGTCTG CCTACCCTCA 15 60 

5 

GGAATATTTT TTGTCTGTGG TACCTCAGCC TATCGTTGTT TGAATGGCTC TTCAGAATCT 1620 
ATGTGCTTCC TCTCATTCTT AGTGCCGCCT ATGACCATCT ACACTGAACA AGATTTATAC 1680 
10 AGTTATGTCA TATCTAAGCC CCGCAACAAA AGAGTACCCA TTCTTCCTTT TGTTATAGGA 1740 
GCAGGAGTGC TAGGTGCACT AGGTACTGGC ATTGGCGGTA TCACAACCTC TACTCAGTTC 1800 
TACTACAAAC TATCTCAAGA ACTAAATGGG GACATGGAAC GGGTCGCCGA CTCCCTGGTC 1860 

15 

ACCTTGCAAG ATCAACTTAA CTCCCTAGCA GCAGTAGTCC TTCGAAATCG AAGAGCTTTA 19 20 
GACTTGCTAA CCGCTGAGAG AGGGGGAACC TGTTTATTTT TAGGGGAAGA ATGCTGTTAT 1980 

2 0 TATGTTAATC AATCCGGAAT' CGTCACTGAG AAAGTTGAAG AAATTCCAGA TCGAATACAA 2040 

CGTATAGCAG AGGAGCTTCG AAACACTGGA CCCTGGGGCC TCCTCAGCCG ATGGATGCCC 2100 
TGGATTCTCC CCTTCTTAGG ACCTCTAGCA GCTATAATAT TGCTACTCCT CTTTGGACCC 2160 

25 

TGTATCTTTG ACCTCCTTGT TAACTTTGTC TCTTCCAGAA TCGAAGCTGT GAAACTACAA 2220 
ATGGAGCCCA AGATGCAGTC CAAGACTAAG ATCTACCGCA GACCCCTGGA CCGGCCTGCT 2280 

3 0 AGCCCACGAT CTGATGTTAA TGACATCAAA GGCACCCCTC CTGAGGAAAT CTCAGCTGCA 2340 

CAACCTCTAC TACGCCCCAA TTCAGCAGGA AGCAGTTAGA GCGGTGGTCG GCCAACCTCC 2400 
CCAACAGCAC TTAGGTTTTC CTGTTGAGAT GGGGGACTGA GAGACAGGAC TAGCTGGATT 2460 

35 

TCCTAGGCTG ACTAAGAATC CTTAAGCCTA GGTGGGAAGG TGACCACATC CACCTTTAAA 2520 

FEUILLE DE REflflPLACEftflENT (REGLE 26) 
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CACGGGGCTT GCAACTTAGC TCACACCTGA CCAATCAGAG AGCTCACTAA AATGCTAATT 2 5 80 

AGGCAAAGAC AGGAGGTAAA GAAATAGCCA ATCATTTATT GCCTGAGAGC ACAGCAGGAG 2 640 

5 

GGACAATGAT CGGGATATAA ACCCAAGTTT TCGAGCCGGC AACGGCAACC CCCTTTGGGT 2 700 

CCCCTCCCTT TGTATGGGAG CTCTGTTTTC ATGCTATTTC ACTCTATTAA ATCTTGCAAC 2 7 60 

10 TGCAAAAAAA AAAAAAAAAA AA 2 7 82 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 666 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

20 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 
(iii) HYPOTHETIQUE: NON 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

TGTCCGCTGT GCTCCTGATC CAGCGAGGCG CCCATTGCCG CTCCCAATTG GGCTAAAGGC 60 
TTGCCATTGT TCCTGCACGG CTAAGTGCCT GGGTTTGTTC TAATTGAGCT GAACACTANT 120 

30 

CACTGGGTTC CATGGTTCTC TTCTGTGACC CACGGCTTCT AATATAACTA TAACACTTAC 180 
CACATGGCCC AAGATTCCAT TCCTTGGAAT CCGTGAGGCC AAGAACTCCA GGTCAGAGAA 2 40 
35 TACGAGGCTT GCCACCATCT TGGAAGCGGC CTGCTACCAT CTTGGAAGTG GTTCACCACC 300 
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ATCTTGGGAG CTCTGTGAGC AAGGACCCCC CGGTAACATT TTGGCAACCA CGAACGGACA 360 



TCCAAAGTGA ATCGAAGCTG TAAAACTACA AATGGAGCCC AAGATGCAGT CCAAGACTAA 420 



5 GATCTACCGC AGACCCCTGG ACCGGCCTGC TAGCCCACGA TCTGATGTTA ATGACATCAA 480 



AGGCACCCCT CCTGAGGAAA TCTCAGCTGC ACAACCTCTA CTACGCCCCA ATTCAGCAGG 540 



10 



15 



25 



35 



AAGCAGTTAG AGCGGTCGTC GGCCAACCTC CCCAACAGCA CTTAGGTTTT CCTGTTGAGA 600 



TGGGGGACTG AGAGACAGGA CTAGCTGGAT TTCCTAGGCT GACTAAGAAT CCCTAAGCCT 660 



AGCTGG 666 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3372 paires de bases 
20 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ARNm (en ADN ) 
(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

3 0 GACTTCCCAA ATACCAGAGG AAGCAGAGTG GTTTACAGTC CTGGACCTTC AGGATGCCTT 60 

CTTCTGCATC CCTGTACATC CTGACTCTCA ATTCTTGTTT GCCTTTGAAG ATACTTCAAA 120 

CCCAGCATCT CAACTCACCT GGACTATTTT ACCCCAAGGG TTCAGGGATA GTCCCCATCT 180 



ATTTGGCCAG GCATTAGCCC AAGACTTGAG CCAATCCTCA TACCTGGACA CTTGTCCTTC 240 
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GGTAGGTGGA TGATTTACTT TTGGCCGCCC ATTCAGAAAC CTTGTGCCAT CAAGCCACCC 300 

AAGCGCTCTT CAATTTCCTC GCTACCTGTG GCTACATGGT TTCCAAACCA AAGGCTCAAC 360 

5 

TCTGCTCACA GCAGGTTACT TAGGGCTAAA ATTATCCAAA GGCACCAGGG CCCTCAGTGA 420 

GGAACACATC CAGCCTATAC TGGCTTATCC TCATCCCAAA ACCCTAAAGC AACTAAGGGG 480 

10 ATTCCTTGGC GTAATAGGTT TCTGCCGAAA ATGGATTCCC AGGTATGGCG AAATAGCCAG 540 

GTCATTAAAT ACACTAATTA AGGAAACTCA GAAAGCCAAT ACCCATTTAG TAAGATGGAC 600 

AACTGAAGTA GAAGTGGCTT TCCAGGCCCT AACCCAAGCC CCAGTGTTAA GTTTGCCAAC 660 

15 

AGGGCAAGAC TTTTGTTCAT ATGTCACAGA AAAAACAGGA ATAGCTCTAG GAGTCCTTAC 720 

ACAGATCCGA GGGATGAGCT TGCAACCTGT GGC ACACCTG ACTAAGGAAA TTGATGTAGT 780 

2 0 GGCAAAGGGT TGACCTCATT GTTTACGGGT AGTGGTGGCA GTAGCAGTCT TAGTATCTGA 840 

AGCAGTTAAA ATAATACAGG GAAGAGATCT TACTGTGTGG ACATCTCATG ATGTGAATGG 900 

CATACTCACT GCTAAAGGAG ACTTGTGGCT GTCAGACAAC TGTTTACTTA AATGTCAGGC 960 

25 

TCTATTACTT GAAGGGCCAG TGCTGCGACT GTGCACTTGT GCAACTCTTA ACCCAGCCAC 1020 

ATTTCTTCCA GACAATGAAG AAAAGATAAA ACATAACTGT CAACAAGTAA TTTCTCAAAC 1080 

3 0 CTATGCCACT CGAGGGGACC TTTTAGAGGT TCCTTTGACT GATCCCGACC TCAACTTGTA 1140 

TACTGATGGA AGTTCCTTTG TAGAAAAAGG ACTTCGAAAA GTGGGGTATG CAGTGGTCAG 1200 

TGATAATGGA ATACTTGAAA GTAATCCCCT CACTCCAGGA ACTAGTGCTC AGCTAGCAGA 1260 

35 

ACTAATAGCC CTCACTTGGG CACTAGAATT AGGAGAAGAA AAA AGGG C A A ATATAATACA 132 0 

FEUILLE DE RERflPLACEMENT (REGLE 26) 
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GACTCTAAAT ATGCTTACCT AGTCCTCCAT GCCCATGCAG CAATATGGAA AGAAAGGGAA 13 80 
TTCCTAACTT CTGAGAGAAC ACCTATCAAA CATCAGGAAG CCATTAGGAA ATTATTATTG 1440 

5 

GCTGTACAGA AACCTAGAGA GGTGGCAGTC TTACACTGCC GGGGTCATCA CAAAGGAAAG 1500 
GAAAGGGAAA TACAAGAGAA CTGCCAAGCA TATATTGAAG CCAAAAGAGC TGCAAGGCAG 15 60 
10 GACCCTCCAT TAGAAATGCT TATTAAACTT CCCTTAGTAT AGGGTAATCC CTTCCGGGAA 1620 
ACCAAGCCCC AGTACTCAGC AGGAGAAACA GAATGGGGAA CCTCACGAGG CAGTTTTCTC 1680 
CCCTCGGGAC GGTTAGCCAC TGAAGAAGGG AAAATACTTT TGCCTGCAAC TATCCAATGG 17 40 

15 

AAATTACTTA AAACCCTTCA TCAAACCTTT CACTTAGGCA TCGATAGCAC CCATCAGATG 1800 
GCCAAATCAT TATTTACTGG ACCAGGCCTT TTCAAAACTA TCAAGCAGAT AGTCAGGGCC 1860 

2 0 TGTGAAGTGT GCCAGAGAAA TAATCCCCTG CCTTATCGCC AAGCTCCTTC AGGAGAACAA 1920 

AGAACAGGCC ATTACCCTGG AGAAGACTGG CAACTGATTT TACCCACAAG CCCAAACCTC 1980 
AGGGATTTCA GTATCTACTA GTCTGGGTAG ATACTTTCAC GGGTTGGGCA GAGGCCTTCC 2040 

25 

CCTGTAGGAC AGAAAAGGCC CAAGAGGTAA TAAAGGCACT AGTTCATGAA ATAATTCCCA 2100 
GATTCGGACT TCCCCGAGGC TTACAGAGTG ACAATAGCCC TGCTTTCCAG GCCACAGTAA 2160 

3 0 CCCAGGGAGT ATCCCAGGCG TTAGGTATAC GATATCACTT ACACTGCGCC TGAAGGCCAC 2 2 20 

AGTCCTCAGG GAAGGTCGAG AAAATGAATG AAACACTCAA AGGACATCTA AAAAAGCAAA 2280 
CCCAGGAAAC CCACCTCACA TGGCCTGTTC TGTTGCCTAT AGCCTTAAAA AGAATCTGCA 2340 

35 

ACTTTCCCCA AAAAGCAGGA CTTAGCCCAT ACGAAATGCT GTATGGAAGG CCCTTCATAA 2400 
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CCAATGACCT TGTGCTTGAC CCAAGACAGC CAACTTAGTT GCAGACATCA CCTCCTTAGC 2 460 
CAAATATCAA CAAGTTCTTA AAACATTACA AGGAACCTAT CCCTGAGAAG AGGAAAAGAA 2 520 

5 

TATTCCACCC AAGTGACATG GTATTAGTCA AGTCCCTTCC CTCTAATTCC CCATCCCTAG 2 580 
ATACATCCTG GGAAGGACCC TACCCAGTCA TTTTATCTAC CCCAACTGCG GTTAAAGTGG 2640 
10 CTGGAGTGGA GTCTTGGATA CATCACACTT GAGTCAAATC CTGGATACTG CCAAAGGAAC 2 700 
CTGAAAATCC AGGAGACAAC GCTAGCTATT CCTGTGAACC TCTAGAGGAT TTGCGCCTGC 2760 
TCTTCAAACA ACAACCAGGA GGAAAAATCG AAGCTGTAAA ACTACAAATG GAGCCCAAGA 282 0 

15 

TGCAGTCCAA GACTAAGATC TACCGCAGAC CCCTGGACCG GCCTGTTAGC CCACGATCTG 2880 
ATGTTAATGA CATCAAAGGC ACCCCTCCTG AGGAAATCTC AGCTGCACAA CCTCTACTAC 2940 

2 0 GCCCCAATTC AGCAGGAAGC AGTTAGAGCG GTCGTCGGCC AACCTCCCCA ACAGCACTTA 3000 

GGTTTTCCTG TTGAGATGGG GGACTGAGAG ACAGGACTAG CTGGATTTCC TAGGCTGATT 3060 
AAGAATCCCT AAGCCT AG CT GGGAAGGTGA CCACATCCAC CTTTAAACAC GGGGCTTGCA 3120 

25 

ACTTAGCTCA CACCTGACCA ATCAGAGAGC TCACTAAAAT GCTAATTAGG CAAAGACAGG 3180 
AGGTAAAGAA ATAGCCAATC ATTTATTGCC TGAGAGCACA GCAGGAGGGA CAATGATCGG 3240 

3 0 GATATAAACC CAAGTTTTCG AGCCGGCAAC GGCAACCCCC TTTGGGTCCC CTCCCTTTGT 3300 

ATGGGAGCTC TGTTTTCATG CTATTTCACT CTATTAAATC TTGCAACTGC AAAAAAAAAA 3360 
AAAAAAAAAA AA 3372 

35 

FEUILLE DE RERflPLACERflENT (REGLE 26) 
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<2) INFORMATIONS POUR LA SEQ ID NO: 10: 



<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2372 paires de bases 



5 



(B) TYPE: nucleotide 



<C) NOMBRE DE BRINS: simple 



(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ARNm (en ADN ) 



10 



(iii) HYPOTHETIQUE: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 



15 ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 

CACTGCTGTT TGCCACCACC GCAGACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

20 

GCTTGCCATT GTTCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 2 40 

ATCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

2 5 ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG CCAAGAACTC CAGGTCAGAG 360 

AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC GTCTTGGAAG TGGTTCACCA 420 

CCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CAACGACGGA 480 



CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA CGTATTCTGG 540 
AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA TTCTTCTGCA 600 
35 GTGCCGCCTG GCACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA GCTAGACCTC 660 



30 
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TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT TTCATTAAGA 7 20 
GACAACTCAC AATTATGTAA AAAGTGTGAT TTATGCCCTA CAGGAAGCCT TCAGAGTCTA 7 80 
5 CCTCCCTATC CCAGCATCCC CGACTCCTTC CCCAACTAAT AAGGACCCCC CTTCAACCCA 840 
AATGGTCCAA AAGGAGATAG ACAAAAGGGT AAACAGTGAA CCAAAGAGTG CCAATATTCC 900 
CCAATTATGA CCCCTCCAAG CAGTGGGAGG AAGAGAATTC GGCCCAGCCA GAGTGCATGT 960 

10 

GCCTTTTTCT CTCCCAGACT TAAAGCAAAT AAAAACAGAC TTAGGTAAAT TCTCAGATAA 102 0 
CCCTGATGGC TATATTGATG TTTTACAAGG GTTAGGACAA TTCTTTGATC TGACATGGAG 1080 
15 AGATATAATG TCACTGCTAA ATCAGACACT AACCCCAAAT GAGAGAAGTG CCACCATAAC 1140 • 
TGCAGCCTGA GGGTTTGGCG TCTCTGGTAT CTCAGTCAGG TCAATGGATA NGGATGACAA 1200 
CAGAAGGAAA GANAATGATT CCCCACAGGC CAGCAGGCAG TTCCCAGTCT AGACCCTCAT 12 60 

20 

TGGGACACAG AATCAGAACA TGGAGATTGG TGCTGCAGAC ATTTGCTAAC TTGTGTGCTA 1320 
GAAGGACTAA GGAAAACTAG GAAGAAGTCT ATGAATTACT CAATGATGTC CACCATAACA 1380 

2 5 CAGGGAAGGG AAGAAAATCC TACTGCCTTT CTGGAGAGAC TAAGGGAGGC ATTGAGGAAG 1440 

CGTGCCTCTC TGTCACCTGA CTCTTCTGAA GGCCAACTAA TCTTAAAGCG TAAGTTTATC 1500 
ACTCAGTCAG CTGCAGACAT TAGAAAAAAC TTCAAAAGTC TGCCGTAGGC CCGGAGCAAA 1560 

30 

ACTTAGAAAC CCTATTGAAC TTGGCAACCT CGGTTTTTTA TAATAGAGAT CAGGAGGAGC 1620 
AGGCGGAACA GGACAAACGG GATTAAAAAA AAGGCCACCG CTTTAGTCAT GACCCTCAGG 1680 

3 5 CAAGTGGACT TTGGAGGCTC TGGAAAAGGG AAAAGCTGGG CAAATTGAAT GCCTAATAGG 1740 
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GCTTGCTTCC AGTGCGGTCT ACAAGGACAC TTTAAAAAAG ATTGTCCAAG TAGAAGTAAG 1800 
CCGCCCCTTC GTCCATGCCC CTTATTTCAA GGGAATCACT GGAAGGCCCA CTGCCCCAGG 1860 
5 GGACAAAGGT CTTTTGAGTC AGAAGCCACT AACCAGATGA TCCAGCAGCA GGACTGAGGG 1920 
TGCCTGGGGC AAGCGCCATC CCATGCCATC ACCCTCACAG AGCCCTGGGT ATGCTTGACC 1980 
ATTGAGGGCC AGGAAGGTTG TCTCCTGGAC ACTGGTGCGG TCTTCTTAGT CTTACTCTTC 2040 

10 

TGTCCCGGAC AACTGTCCTC CAGATCTGTC ACTATTCTGA GGGGGTCCNT AAGACGGGCA 2100 
GTCACTAGAT ACTTTTTCCC AGCCACTAAG TTATGAACTG GGGAGCTTTA TTCTTTTCAC 2160 
15 ATGCTTTTCT AATTATGCTT GAAAGCCCCA CTACCTTGTT AGGGAGAGAC ATTCTAGCAA 22 20 
AAGCAGGGGC CATTATACAC CTGAACATAG GAGAAGGAAC ACCCGTTTGT TGTNCCCCTG 2280 
CTTGAGGAAG GAATTAATCC TGAAGTCTGG GCAACAGAAG GACAATATGG ACGAGCCAAA 2340 

20 

GAATGCCCGT CCTGTTCAAG TTAAACTAAA GG 237 2 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

25 

(i) CARACTERI STIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 7582 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
30 ( D ) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN ) 

( iii) HYPOTHETIQUE: NON 

35 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
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CAACAATCGG 


GATATAAACC 


CAGGCATTCG 


AGCTGGCAAC 


AGCAGCCCCC 


CTTTGGGTCC 


60 




CTTCCCTTTG 


TATGGGAGCT 


GTTTTCATGC 


TATTTCACTC 


TATTAAATCT 


TGCAACTGCA 


120 




CTCTTCTGGT 


CCATGTTTCT 


TACGGCTCGA 


GCTGAGCTTT 


TGCTCACCGT 


CCACCACTGC 


180 


5 


TGTTTGCCAC 


CACCGCANAC 


CTGCCGCTGA 


CTCCCATCCC 


TCTGGATCCT 


GCAGGGTGTC 


240 




CGCTGTGCTC 


CTGATCCAGC 


GARGCGCCCA 


TTGCCGCTCC 


CAATTGGGCT 


AAAGGCTTGC 


300 




CATTGTNCCT 


GCACGGCTAA 


GTGCCTGGGT 


TTGTTCTAAT 


TGAGCTGAAC 


ACTANTCACT 


360 




GGGTTCCATG 


GTTCTCTTCT 


GTGACCCACG 


GCTTCTAATA 


KAACTATAAC 


ACTTACCACA 


420 




TGGCCCAAGA 


TTCCATTCCT 


TGGAATCCGT 


GAGGSCAACG 


AACTCCAGGT 


CAGAGAATAC 


480 


10 


GARGCTTGCC 


ACCATCTTGG 


AAGCGGCCTG 


CTACCRTCTT 


GGAAGTGGTT 


CACCACCATC 


540 




TTGGGAGCTC 


TGTGAGCAAG 


GACCCCCCGG 


TRACATTTTG 


GCRACCAMSR 


ACGGACATCC 


600 




MAAGTGATGG 


GAAACGTTCC 


CCGCAAGACA 


AAAACGCCCC 


TAAGACGTAT 


TCTGGARAAT 


660 




TGGGAMCAAT 


TTGACCCTCA 


GACACTAAGA 


AAGAAACGAC 


TTATATTCTT 


CTGCAGTGCC 


720 




GCCTGGCACT 


CCTGAGGGAA 


GTATAAATTA 


TAACACCATC 


TTACAGCTAG 


ACYTCTTTTG 


780 


15 


TAGAAAAGGC 


AAATGGAGTG 


AAGTGCCATA 


AGTACAAACT 


TTCTTTTCAT 


TAAGAGACAA 


840- 




CTCACAATTA 


TGTAAAAAGT 


GTGATTTATG 


CCCTACAGGA 


AGCCTTCAGA 


GTCTACCTCC 


900 




CTATCCCAGC 


ATCCCCGACT 


CCTTCCCCAM 


YTAATAAGGA 


CCCCCCTTCA 


ACCCAAATGG 


960 




TCCAAAAGGA 


GATAGACAAA 


AGGGTAAACA 


G TG A ACC AAA 


GAGTGCCAAT 


ATTCCCCAAT 


1020 




TATGACCCCT 


CCCAAGCAGT 


GGGAGGAAGA 


GAATTCGGCC 


CAGCCAGAGT 


GCATGTGCYT 


1080 


20 


TTTYYTCTCC 


CAGACTTAAA 


GCAAATAAAA 


ACAGACTTAG 


GTAAATTCTC 


AGATAAYCCT 


1140 




GATGGCTATA 


TTGRTGTTTT 


ACAAGGGTTA 


GGACAATTCT 


TTGATCTGAC 


ATGGAGAGAT 


1200 




ATATATGTCA 


CTGCTAAATC 


AGACACTAAC 


CCCAAATGAG 


AGAAGTGCCA 


CCATAACTGC 


1260 




AGCCTGAGRG 


TTTGGCGATC 


TCTGGTATCT 


CAGTCAGGTC 


AATGGATANG 


GATGACAACA 


1320 




GAAGGAAAGA 


NAATGATTCC 


CCACAGGCCA 


GCARGCAGTT 


CCCAGTCTAS 


ACCCTCATTG 


1380 


25 


GGGACACAGA 


AATCAGTAAC 


ATGGGAGATT 


GGTGCTGCAG 


ACATTTGCTA 


ACTTGTGTGC 


1440 




TASAAGGACT 


AAGGAAAACT 


ASGAAGAAAR 


TCTAYGAATT 


ACTCAATGAT 


GTCCACCATA 


1500 




ACACAGGGGA 


AGGGAAGAAA 


ATCCTACTGC 


CTTTCTGGAG 


AGACTAAGGG 


AGGCATTGAG 


1560 




GAAGCGTGCC 


TCTCTGTCAC 


CTGACTCTTC 


TGAAGGCCAA 


CTAATCTTAA 


AGCGTAAGTT 


1620 




TATCACTCAG 


TC AG CTGCAG 


ACATTAGAAA 


AAACTTCAAA 


AGTCTGCCGT 


AGGCCCGGAG 


1680 


30 


CAAAACTTAG 


AAACCCTATT 


GAACTTGGCA 


ACYTCGGTTT 


TTTATAATAG 


AGATCAGGAG 


1740 




GAGCAGGCGG 


AACAGGACAA 


ACGGGATTAA 


A A AAAAGG C C 


ACCGCTTTAG 


TCATGACCCT 


1800 




CAGGCAAGTG 


GACTTTGGAG 


GCTCTGGAAA 


AGGG AAAAG C 


TGGGCAAATT 


GAATGCCTAA 


1860 




TAGGGCTTGC 


TTCCAGTGCG 


GTCTACAAGG 


ACACTTTAAA 


AAAGATTGTC 


CAAGTAGAAG 


1920 




TAAGCCGCCC 


CTTCGTCCAT 


GCCCCTTATT 


TCAAGGGAAT 


CACTGGAAGG 


CCCACTGCCC 


1980 


35 


CAGGGGACAA 


AGGTCTTTTG 


AGTCAGAAGC 


CACTAACCAG 


ATGATCCAGC 


AGCAGGACTG 


2040 




AGGGTGCCTG 


GGGCAAGCGC 


CATCCCATGC 


CATCACCCTC 


ACAGAGCCCT 


GGGTATGCTT 


2100 
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GACCATTGAG GGCCAGGAAG GTTGTCTCCT GGACACTGGT GCGGTCTTCT TAGTCTTACT 2160 
CTTCTGTCCC GGACAACTGT CCTCCAGATC TGTCACTATT CTGAGGGGGT CCNTAAGACG 2220 
GGCAGTCACT AGATACTTTY TCCCAGCCAC TAAGTTATGA ACTGGGGAGC TTTATTCTTT 2280 
TCACATGCTT TTCTAATTAT GCTTGAAAGC CCCACTACCT TGTTAGGGAG AGACATTCTA 2340 
5 GCAAAAGCAG GGGCCATTAT ACACCTGAAC ATAGGAGAAG GAACACCCGT TTGTTGTNCC 2400 
CCTGCTTGAG GAAGGAATTA ATCCTGAAGT CTGGGCAACA GAAGGACAAT ATGGACGAGC 2460 
CAAAGAATGC CCGTCCTGTT CAAGTTAAAC TAAAGGATTC CACTTCCTTT CCCTACCAAA 2 52 0 
GGCAGTACCC CCTCAGACCC AAGGCCCAAC AAGGATTCCA AAAGATTGTT AAGGACTTAA 2 580 
AAGCCCAAGG CTTAGTAAAA CCATGCATAA CTCCCTGCAG TAATTCCGTA GTGGATTGAG 2 640 

10 GAGGCACAGA AACCCAGTGG ACAGTGGAGG GTTAGTGCAA GATCTCAGGA TTATCAATGG 2700 
AGGCCGTTGT CCTTTTATAC CCAGCTGTAC CTAGCCCTTA TACTGTGMYT TCCCAAATAC 2 7 60 
CAGAGGAAGC AGAGTGGTTT ACASTCCTGG ACCTTMAGGA TGCCTTCTTC TGCATCCCTG 2820 
TACATCCTGA CTCTCAATTC TTGTTTGCCT TTGAAGATAC TTCAAACCCA RCATCTCAAC 2 880 
TCACCTGGAC TRTTTTACCC CAAGGGTTCA GGGATAGYCC CCATCTATTT GGCCAGGCAT 2940 

15 TAGCCCAAGA CTTGAGYCAR TYMTCATACC TGGACACTCT TGTCCTTCRG TAKGTGGATG 3000 
ATTTACTTTT RGCYGCCYRT TCAGAAACCT TGTGCCATCA AGCCACCCAA GCRCTCTTMA 3060 
ATTTCCTCGC YACCTGTGGC TACAWGGTTT CCAAACSARA RGCTCARCTC TGCTCACAGC 3120 
AGGTTAAATA CTTAGGRCTA ARATTATCCA AAGGCACCAR GGCCCTCAGT GAGGAAYRYA 3180 
TCCAGCCTAT ACTGGCTTAT CCTCATCYCA AAACCCTAAA GCAACTAAGR GRRTTCCTTG 3240 

2 0 GCRTAAYAGG YTTCTGCCGA AWATGGATTC CCCAGGTWTG GCRAAATAGC CAGGYCATTA 3 300 
WATACASTAA TTAAGGAAAC TCAGAAAGCC AATACCCATT TARTAAGATG GAYAMCTGAA 3360 
GYMRAAGTGG CTTTCCAGGC CCCTAAAGAA GGCCTTAAAC CCAAGYCCCA GTGTTAAGYT 3420 
TGCCAACRGG GCAAGACTTT TSTTYATAYR TC AC AG AAA A AAACAGRAAY AGCTCTRGGA 3480 
GTCCTTACAC AGRTCCRAGG GAYGAGCTTG CAACCYRTGG CRYACCTGAS TAAGGAAAYT 3540 

2 5 GATGTAGTGG CAAAGGGTTG RCYTCATTGT TTAYGGGTAG TGGTGGCAGT AGCAGTYKTA 3600 

GTATCTGAAG CAGTTAAAAT AATACAGGGR AGAGATCTTA CTGTGTGGAC ATCTCATGAK 3660 
GTGAAYRGCA TACTCACTGC TAAAGGAGAC TTGTGGCTGT CAGACAACYG TTTACTTAAA 3720 
TRTCAGGCTC TATTACTTGA ARGGCCAGTG CTGCRACTGT GCACTTGTGC AACTCTTAAC 3780 
CCAGYCNCAT TTCTTCCAGA CAATGAAGAA AAGATARAAY ATAACTGTCA ACAARTAATT 3840 

3 0 TCTCAAACCT ATGCCACTCG AGGGGACCTT YTAGARGTTC CYTTGACTGA TCCYGACCTT 3900 

CAACTTGTAT ACTGATGGAA GTTCCTTTGT AGAAAAAGGA CTTCGAAAAG YGGGGTATGC 3960 
AGTGGTCAGT GATAATGGAA TAYTTGAAAG TAATCCCCTC ACTCCAGGAA CTAGTGCTYA 4020 
GCTRGCAGAA CTAATAGCCY TCAYTKGGGC ACTAGAATTA GGAGAAGRAA AAAGGGYAAA 4080 
TATATATACA GACTCTRART ATGCTYACCT AGTCNTCCAT GCCCATGMRG CAATATGSAR 4140 
3 5 AGAAAGGGAA TTCCTAACTT CYGAGRGAAC ACCTATCAMA CATCAGGAAG CCATTAGGAR 4200 
ATT ATT AY TG GCWGTACAGA AACCTARAGA GGTGGMAGTC TTACACTGCY GGGGTCATCA 4260 
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NAAAGGAAAG RAAAGGGAAA TASAAGRGAA 
TGCAAGGCAG GACCCTCCAT TAGAAATGCT 
CTTCCGGGAA ACCAAGCCCC AGTACTCAGC 
CAGTTTTCTC CCCTCGGGAC GGTTAGCCAC 
5 TATCCAATGG AAATTACTTA AAACCCTTCA 
CCATCARATG GCCAAATCAT TATTTACTGG 
AKTCAGGGCC TGTGAAKTGT GCCARARAAA 
AGGARAACAA ARAACAGGCC ATTACCCTGR 
CCCAAACCTC AGGGATTTCA GTATCTACTA 

10 RAGGCCTTCC CCTGTAGGAC AGAAAAGGCC 
ATAATTCCCA GATTCGGACT TCCCCGAGGC 
GCCACAGTAA CCCAGGGAGT ATCCCAGGCG 
TGAAGGCCAC AGTCCTCAGG GAAGGTCGAG 
AAAAAGCAAA CCCAGGAAAC CCACCTCACA 

15 AGAATCTGCA ACTTTCCCCA AAAAGCAGGA 
CCCTTCATAA CCAATGACCT TGTGCTTGAC 
CCTCCTTAGC CAAATATCAA CAAGTTCTTA 
AGGGAAAAGA ACTATTCCAC CCWWGTGACA 
CCCCATCCCT AGATACATCC TGGGAAGGAC 

2 0 CGGTTAAAGT GGCTGGAGTG GAGTCTTGGA 

TGCCAAAGGA ACCTGAAAAT CCAGGAGACA 
ATTTGCGCCT GCTCTTCAAA CAACAACCAG 
ATGGSCCTCC CTTATCATAT TTTTCTCTKT 
GCACCCCCTC CATGCCGCTG TATGACCAGT 
25 ATGCAGCGTC CCGGAAATAT TGATGCCCCA 
ACCTTCACTG CCCACACCCA TATGCCCCGC 
CATGCAAATA CTCATTATTG GACAGGAAAA 
GGAGTCACTG TCTGTTGGAC TTACTTCACC 
CAAGATCAGG CAAGAGAAAA ACATGTAAAA 

3 0 GGCACCTCTA GCCCCTACAA AGGACTAGAT 

CATACTCGCC TGGTAAGCCT ATTTAATACC 
CAAAACCCTA CTAACTGTTG GATATGCCTC 
CCTGTACCTG AACAATGGAA CAACTTCAGC 
GGACCTCTTG TTTCCAATST GGAAATAACC 
3 5 AGCAATACTA CATACACAAC CAACTCCCAA 
ATAGTCTGCC TACCCTCAGG AATATTTTTT 
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YTGCCAAGCA 


KATATTGAAG 


CMAAAAG AG C 


4320 


TATTAAACTT 


CCCTTAGTAT 


AGGGTAATCC 


4380 


AGGAGAAACA 


GAATGGGGAA 


CCTCACGAGG 


4440 


TGAAGAAGGG 


AAAATACTTT 


TGCCTGCAAC 


4500 


TCAAACCTTT 


CACTTAGGCA 


TCGATAGCAC 


4560 


ACCAGGCCTT 


TTCAAAACTA 


TCAAGCARAT 


4620 


TAATCCCCTG 


CCTYATCGCC 


AAGCTCCTTC 


4680 


ARAARACTGG 


CAACTGATTT 


TACCCACAAG 


4740 


GTCTGGGTAR 


ATACTTTCAC 


GGGTTGGGCA 


4800 


CAAGAGGTAA 


TAAAGGCACT 


AGTTCATGAA 


4860 


TTACAGAGTG 


ACAATAGCCC 


TGCTTTCCAG 


4920 


TTAGGTATAC 


GATATCACTT 


ACACTGCGCC 


4980 


AAAATGAATG 


AAAYACTCAA 


AGGACATCTA 


5040 


TGGCCTGYTC 


TGTTGCCTAT 


AGCCTTAAAA 


5100 


CTTAGCCCAT 


ACGAAATGCT 


GTATGGAAGG 


5160 


CCAAGACAGC 


CAACTTAGTT 


GCAGACATCA 


5220 


AAACATTACA 


AGGAACCTAT 


CCCTGAGAAG 


5280 


TGGTATTAGT 


CAAGTCCCTT 


CYCTCTAATT 


5340 


CCTACCCAGT 


CATTTTATYT 


ACCCCAACTG 


5400 


TACATCACAC 


TTGAGTCAAA 


TCCTGGATAC 


5460 


ACGCTAGCTA 


TTCCTGTGAA 


CCTCTAGAGG 


5520 


GAGGAAAGTA 


ACTAAAATCA 


TAAATCCCCC 


5580 


ASTGTTSTTT 


YACCCTSTTT 


CACTCTCACT 


5640 


AGCTCCCCTY 


ACCMAGAGTT 


TCTATGGAGA 


5700 


TCGTATAGGAG TCTTTSTAAG GGAACCCCC 


5760 


AACTGCTATC 


ACTCTGCCAC 


TCTTTGCATG 


5820 


ATGATTAATC 


CTAGTTGTCC 


TGGAGGACTT 


5880 


CAAACTGGTA 


TGTCTGATGG 


GGGTGGAGTT 


5940 


GAAGTAATCT 


CCCAACTCAC 


CSGGGTACAT 


6000 


CTCTCAAAAC 


TACATGAAAC 


CCTCCGTACC 


6060 


ACCCTCACTG 


GGCTCCATGA 


GGTCTCGGCC 


6120 


CCCCTGAACT 


TCARGCCATA 


TGTTTCAATC 


6180 


ACAGAAATAA 


ACACCACTTC 


CGTTTTAGTA 


6240 


CATACCTCAA 


ACCTCACCTG 


TGTAAAATTT 


6300 


TGCATCAGGT 


GGGTAACTCC 


TCCCACACAA 


6360 


GTCTGTGGTA 


CCTCAGCCTA 


TCGTTGTTTG 


6420 
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AATGGCTCTT 


CAGAATCTAT 


GTGCTTCCTC 


TCATTCTTAG 


TGCCCCCYAT 


GRCCATCTAC 


6480 


ACTGAACAAG 


ATTTATACAG 


TTATGTCATA 


TCTAAGCCCC 


GCAACAAAAG 


AGTACCCATT 


6540 


CTTCCTTTTG 


TTATAGGAGC 


AGGAGTGCTA 


GGTGCACTAG 


GTACTGGCAT 


TGGCGGTATC 


6600 


ACAACCTCTA 


CTCAGTTCTA 


CTACAAACTA 


TCTCAAGAAC 


TAAATGGGGA 


CATGGAACGG 


6660 


GTCGCCGACT 


CCCTGGTCAC 


CTTGCAAGAT 


CAACTTAACT 


CCCTAGCAGC 


AGTAGTCCTT 


6720 


CRAAATCGAA 


GAGCTTTAGA 


CTYGCTAACC 


GCTGARAGAG 


GGGGAACCTG 


TTTATTTTTA 


6780 


GGGGAAGAAT 


GCTGTTATTA 


TGTTAATCAA 


TCCGGAATCG 


TCACTGAGAA 


AGTTRAAGAA 


6840 


ATTCSAGATC 


GAATACAACG 


TAKAGCAGAR 


GAGCTTCGAA 


ACACTGGACC 


CTGGGGCCTC 


6900 


CTCAGCCRAT 


GGATGCCCTG 


GATTCTCCCC 


TTCTTAGGAC 


CTCTAGCAGC 


TATAATATTG 


6960 


CTACTCCTCT 


TTGGACCCTG 


TATCTTTRAC 


CTCCTTGTTA 


ACTTTGTCTC 


TTCCAGAATC 


7020 


GAAGCTGTRA 


AACTACAAAT 


GGAGCCCAAG 


ATGCAGTCCA 


AGACTAAGAT 


CTACCGCAGA 


7080 


CCCCTGGACC 


GGCCTGYTAG 


CCCACGATCT 


GATGTTAATG 


ACATCAAAGG 


CACCCCTCCT 


7140 


GAGGAAATCT 


CAGCTGCACA 


ACCTCTACTA 


CGCCCCAATT 


CAGCAGGAAG 


CAGTTAGAGC 


7200 


GGTSGTCGGC 


CAACCTCCCC 


AACAGCACTT 


AGGTTTTCCT 


GTTGAGATGG 


GGGACTGAGA 


7260 


GACAGGACTA 


GCTGGATTTC 


CTAGGCTGAY 


TAAGAATCCY 


TAAGCCTAGS 


TGGGAAGGTG 


7320 


ACCACATCCA 


CCTTTAAACA 


CGGGGCTTGC 


AACTTAGYTC 


ACACCTGACC 


AATCAGAGAG 


7380 


CTCACTAAAA 


TGCTAATTAG 


GCAAAGACAG 


GAGGTAAAGA 


AATAGCCAAT 


CATYTATTGC 


7440 


MTGAGAGCAC 


AGCAGGAGGG 


ACAATGATCG 


GGATATAAAC 


CCAAGTYTTC 


GAGCCGGCAA 


7500 


CGGCAACCCC 


CTTTGGGTCC 


CCTCCCTTTG 


TATGGGAGCT 


CTGTTTTCAT 


GCTATTTCAC 


7560 


TCTATTAAAT 


CTTGCARCTG 


CR 








7582 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 
2 5 (i) CARACTERISTIQUES DE LA SEQUENCE: 



(A) LONGUEUR: 2563 paires de bases 



(B) TYPE: nucleotide 



(C) NOMBRE DE BRINS : simple 



(D) CONFIGURATION: lineaire 



30 



(ii) 



TYPE DE MOLECULE: ADN 



(iii) 



HYPOTHETIQUE: NON 



35 



(xi) 



DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
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ACTGCACTCT TCTGGTCCAT GTTTGTTACG GCTCGAGCTG AGCTTTTGCT CGCCATCCAC 60 

CACTGCTGTT TGCCACCGTT GCAGACCCAC TGCTGACTTC CATCCCTCTG GATCTGGCAG 120 

5 GGTGTCTGCT GTGCTCCTGA TCCAGCGAGG GGCCCATTGC CACTCCCAAT CGGGCTAAAG 180 

GCTTGCCATT GTTCCTGCAT GGCTAAGTGC CCAGGTTCAT CCTAATTGAG CTGAACACTA 240 

GTCACTGGGT TCCACAGTTC TCTTCCATGA ACCACGGCTT TTAATAGAGC TATAACACTC 300 

10 

ATCGCAAGGC CCAAGATTCC ATTCCTTGG A ATCTGTGAGG CCAAGAACCC TAGGTCAGAG 360 

AACACGAGGC TTGCCACCAT CTTGGAAGCA GCCTGCCACC ATCTGGGAAG CGGCCTGCCA 420 

15 CCATCTTGGA AGCCGCCCGC CACCATCTTG GG AGCTCTGG GAGCAAGGAC CTCCCCGCAA 480 

CCCAGTAACA TTTAGCGACC ACGAAGGGAC CTCCAAAGCG GTAATATTGG ACCACTTTCA 540 

CTTGCTATTC TGTCCTATCC TTCCTTAGAA TTGGAGGAAA ATACCGGACA CCTGTCGGCC 600 

20 

GGTTAAAAAC GATTAGCGTG GCCTCCGGAC TTAAGAATCA GGTGTGAGGC TATCTGGGGA 660 

AGGGCTTTCT AACAACCCCC AACCRTTCTG GGTTGGGAAT GTTGGTCTGC CTGGAGCCAG 720 

2 5 CTTCCACTTT CAATTTTCCT GGGGAAGCCA AGGGCCGACT AGAGGCAGAA AGCTGTTGTC 780 

CCAAATTCCC GGCAGTAGCC GGTTGAGATC ATGGCGCAGC CAGAAGTCTT TACTCCACAG 840 

TCACCCATGC ATGCGCCCCT ATCTTTCCTT CTGACCCATA CCTCCTGGGT CCTAACCATG 900 

30 

ACTTTCTTAA AAGGGTAGCC CCAAAATTCT CCTTACCTCT GAATCTACTT CCTCTGATCC 960 

CTGCCTCCTA GGTGCTAATG GTTCAGACTT TCATTTCCTC TAGCAAGTTG TATYTCCAAA 1020 

35 GGGATATAAG GAAGCTCTAC ACTGTATCCT TAGGCATCTA GGCTCTAAAC CCAGGGAGTC 1080 
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TTGTCCCTGA TGTCCCAACC GATTTAGGTA TATAGTTCTC GACATGGGCA GTTATGTGGG 1140 
ACCCATTCCC CACCACCCTT GCCAGGGCCC CAAGTTTGTA AATGGCTAAG AGAGGAAAGT 1200 
5 GAGAGAGAGA GAGACAGAGT GAGACACAGA GAGAGGGAGA G AC AG AG AG A GAGACAGAGA 1260 
GG AG AG AG AC ACAGAGAGGG GAGAGACACA GAGAGGAGAA GGGGGCAGAG AGACCAAGAG 1320 
GGAGTCYMAG AG AG AG AG AA AGAAGAAGAA ATAGTAGAAA AAAAAGTGTG CCCTATTCCT 13 80 
TTAAAAGCCA GGGTAAATTT AAAAAACCTA TACTTGATAA TTGAAGGTCT TCTCCATGAC 1440 
CCTGTAACAC TCTAATACTA CCTTGTTCTC AGTGTAAACA AGGGTGTTAG CCTGAAAACA 1500 
15 CTGAGACCGC TGACACCCAT AGCTTTCCTA TAAAAAATCC TTAACCCAGT AACCCGCAGA 1560 
TGGCCCGCAT GCATTCAATC TGTAGTGGCA ACTGCTTTGC TAACAAGAAT AAAGTGGAAA 1620 
AGTAACTTTT AGAGGAAACC TCATTGTGAG CACACCTCAC CAGTTCAGAA TTATTCTAAG 1680 

20 

TCAAAAAAGC AAAAAGGTAG CTTACTAACT CAAAAATCTT AAAGTATGGG GTTATTTTGT 1740 
TAGAAAAAGG TAATTTAACA CTAATCACTG ATAATTCCCT TAACCCAGAA GATTTCCTAA 1800 
2 5 CAGGAGATTT AAATCTTAAT TACCATACAA AGGTCTGACC AGACCTAGGA GGAACTCCCT 1860 
TCAGTACAGG ATGATAGATG GTTCCTCCCA GGTGAATGAA AAAAAAATCA CAATGGGTAT 1920 
TCAGTAATTG ATAGGGAGAC TCTTGTGGAA GCAGAGTTAG AAAAACTGCC TAATAATTGG 1980 

30 

TCTCCCCAAA CCTGCGAGCT GTTTGCACTC AGCCAAGCCT TAAAGTACTT CTAGAATCAA 2040 
AAAGATTATC TCAATCCTGA CTCAAAAGGT TACCTACACC CTCTGTGAAA CGAATTTACT 2100 
35 TAAGAACTGT TTATGGGACT GCATCTTGAT GGGGCAGCTG GGTTGTCATG AAATACTCAG 2160 
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GAATGCAGCC TAGCTCTAGG ACTCACCCCT GAGCACAAAG GCAATGTTGG GCATGCTGGT 2220 

AAAGGACCAC TAGAATCCAG CAGTCCGAAC CCTTTCTTTG GGTTAAGAAA GGCGGGAAAA 2 280 

5 CAGGCGCAGG ACTGCTACAT TGGTAAGCGT AACTAATCCA ATAAGCAGAG GTCCATGGGT 2340 

GGTGACACAC TCTGGAAAGG AATAAGCATT AGRACCATAG AGGACGCTCT ACGACTAATG 2400 

CTCGTCGGAA AATGACTAGA GGTGCTGGCA TCCCTATGTT CTTTTTTCAG ATGGGAAATG 2 4 60 

10 

TTCCCCCTCA AGGCAAAAAC ACCCCTAAGA TGTATTCTGG ACAATTGGGA CCAATTTGAC 2520 
CCTCAGACTC TAAGAAAGAA ACGACTTATA TTCTTCTGCA GTG 2 5 63 

15 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2585 paires de bases 
20 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

25 

(iii) HYPOTHETIQUE : NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
3 0 TCAGGGATAG CCCCCATCTA TTTGGCCAGG TATTAGCCCA AGACTTGAGC CAGTTCTCAT 60 
ACTTGGACAC TCTTGTCCTT TGGTATGTGG ATGATCTACT TTTAGCCACC TGTTCAGAAA 120 
CCTTGTGCCA TCAAGCCAAC CAAGTGCTCT TAAACTTCCT CGCCACCTGT GGCTACAAGG 180 

35 

TTTCCAAACC AGAGGCTCAG CTCTGCTTAC AGCAGGTTAA ATACTTAGGG CTAAAATTAT 2 40 
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CCAAAGGCAC CAGGGCCCTC AGTGAGGAAC GTATCCAGCC TATACTGGCT TATCCTCATC 300 

CCAAAACCCT GAAGCAATTA AGAGGGTTCC TTGGCATAAA AGGCTGCTGT TGAATATGGA 3 60 

5 

TTCCCAGGTA CAATGAAATA GCCAGGCCAT TATACACACT AATTACGGGA ACTCAGAAAG 420 

CCAATACCCA TTTAGTAGAA TGGACACCTG AAGCAGAAGC GGCTTTCCAG GCCCTAAAGA 480 

10 AGGCCCTAAT CCAAGCCCCA GTGTTAAGCT TGCCAATGGA GCAAGACTTT TCTTTATATG 540 

TC AC AG A AAA AAAAACAGGA ATAGCTCTAG AAGTCCTTAC ACAGGTCCGA GGG ACCAGCT 600 

TACAACACAT GGCATACCTG AGTAAGGAAA CTGATGTAGT GGCAAAGGGT TGG ACTCATT 660 

15 

GTTTACAGGT AGTGGCAGCA GTAGCAGTCT TAGCATCTGA AGCAGTTAAA ATGATACAGG 7 20 

GAAGANATCT TACTGTGTGG ACATCTCATG ATGTGAACGG CATACTCACT GCTAAAGGAG 7 80 

2 0 ACTGTGGCTG TCAGACAACC ATTTGCTTAA ATATCAGGCT CTATCACTTG AANGGCCAGT 840 

GCTGCCACTG TGCACTTGTG CAACTCTTAA CCCACCCACA TTTCTTCCAG ACAATGAAGA 900 

AAAGATAGAA CATAACTGTC AACAAGTGAT TGTTCAAACC TACACCGCTC GAAGGGACCT 960 

25 

TCTAGAGGTT CCCTTGACTG ATCCTGAGCT CAACTTCTAT ACTGATGGAA GTTCCTTTTG 1020 

TAGAAAAAGG ACTTCGAAAG GCGGGTATGC AGTGGCCAGT GATAATGGAA TACTTGAAAG 1080 

3 0 TAATCCCTTC ACTCCAGAAA CTAGCATTCA GCTGGCAGAA TTAATAGCCT TCACTTGGGC 1140 

ATTAGAACAC AGGAGAAGGA AAAGGAGTAA ATATATATAC AGACTCCAAG TATGCTTACT 1200 

TAGTCCTCCA TGCCCATGCA GCAATATAGA GAGAAAGCGA ATTCCTAACT TCTGAGGGAA 1260 

35 

CACCTATCAA ACATCAGGAA GCCATTAGGA GATTATTACT GGCTGTACAG AAACCTAGAG 1320 
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GTGGCAGTCT TACATGGCCG AGATCATCAG AAAGGAAAAG AAAGGGAAAT AGAAGGGAAC 1380 
TGCCAAGTGG ATATTGAAGC CAAAAGAGCT GCAAGGCGGG ACCCTCCATT AGAAATGCTT 1440 
ATAGAAGGAC CCCTAGTACA GGGCAATCCC CTTCAGGAAA CCAAGCCCCA ATACTCAGCA 1500 
GAAGAAATGG AATGGGGAAC CTCATGAGGA CATAGTTTCC TCCCCTCAGG ATGGCTAGCC 15 60 
ACCAAAGAAG GAAAAATACT TTTGCCTGCA GCTAACCAAT GGAAATTACT TAAAACCCTT 1620 
CACCAAACCT TTCGCTTAGG CATTGATAGC ACCCATCAGA TGGCTAAATC ATTATTTACT 1680 
AGACCACACC TTTTCAAAAC TATCAAGCAG ACAGTTAGGG CCTGTGAAGT GTGCCAAAGA 1740 
AATAATCCCC TGCCTTATCG CCAAACTCCT TCAGGAGAAA AAAGAACAGG CCATTACCCA 1800 
GGAGAAGAGT GGCAACTAGA TTTTACCCAC ATGCCCAAAT CTCAGGGATT TCAGTATCTA 1860 
CTAGTCTGGG TAGATACTTT CACTGGTTGG GCGGAGGCCT TCCCTTGTAG GACAGAACAG 1920 
GCCCATGAGG TAATAAAGGC ACTAATTCAT GAAATAATTC CCAGATTTGG ATTTCCCCAA 1980 
GGCTTACAGA GTGATAACGG CCCCACTTTC AAGGCTACAG TAACCCAGGG AGTATCCCAG 2040 
ACATTAGACA TACAATATCA CTTACACTGA GCCCGGAGGC CACAATCCTC AGGAAAGTTG 2100 
AGAAAATGAA TGAAACGCTC AAATGACATC T AAA A A AG CT AACCTAAGAA ACCCACCTCT 2160 
CATGGTTTGC TCTGTTGCCT ATAGCCTTAG TAAGAATCCG AAACTCTCCC CAAAAAGCGG 2220 
GACTCAGCCC ATACGAAATG CTGTATGGAC GGCCCTTCCT AACCAATGAC CTTGTGCTTG 2280 
ACCTAGAGAT GGCCAACTTA GTTGCAGATA TCCCTCCTTA GCCAAATATC AACAAGTTCT 2340 
TAAAACGTCA CAGGGAACCT GTCCCTGAGA GGAGGGAAAG GAATTATTCC AACCTGGTGA 2400 
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CATGGTATTA GTGAAGTCCC TTCCCTCCAA CTCCCCATCC CCTGGATACA TCCTGGGAAG 2460 
GACCCTACTC AGTCATTTTA TCTATCCCAA CCGCGGTTAA AATGGCTGGA GTAGAATCTT 2 520 

5 

GGATACATCA CATTCGAGTC AAACCCTAGA TACTGCCACA AGGAACCTGA AAATCCAGGA 2 580 
GACAA 2585 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2575 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



20 



(ii) TYPE DE MOLECULE: ADN 
<iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

2 5 GGGATAGCCC CCATCTATTT GGCCAGGCAT TAGCCCAAGA CTTGAAGCCA ATTCTCATAC 60 

CTGGACACTC TTCTCCTTTG GTATGTGGAT GATTTACTTT TAGCTTCCTG TTCAGAAACC 12 0 

TTGTGCCATC AAGCCACCCA AGCACTCTTA AATTTCCTCG CTACCTGTGG CTACAAGGTT 180 

30 

TCCAAACCAA AG ACCCAG CT CTGCTCACAG CAGGTTAAAT ACTTGGGGCT AAAATTATCC 240 

AAAGGCACCA GGGCCCTCAG TGAGGAACGT ATCAAGCCTA TACTGGCTTA TCCTCATCCC 300 

3 5 CAAATCCTAA AGCAACTAAG AGAGTTCCTT AGCATAACAG GTTTCTGCTG AATATGGATT 360 
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CCCAGGTATG GCAAAATAGC CAGACCATTA TATACGCTAA TTAAGGAAAC TCAGAAAGCC 420 

AATACCCATT TAGTAAGATG GATACCTGAA GCAGAAGCAG CTTTCCAGGC CCTAAAGAGG 480 

5 GCCCTAACCC AAGCCCCAGT GTTAAGCTTG CCAACAGGGC AAGACTTTAC TTCGTATGTC 540 

ACAGAAAAAA CAGGAAATAG CTCTAGGAGT CCTTACACAA GTCTGAGGGA TGAGCTTGCA 600 

ACCCATGGCA TACCTGAGTA AGGAAATTGA TGTAGTGGCA AAGGGTTGGC CTCATTGTTT 660 

10 

ATGGGTAGTG GCGGCAGTAG CAGTCTTAGC ATCTGAAGCA GTTAAAATGA TACAGGGAAG 720 

AGATCTTACT GTGTGGACAT CTCATGATGT GAATGGCATA CTCACTGCTA AAGGAGACTT 780 

15 GTGGCTGTCA GACAACCATT TACTTAAATA TCAGGCTGTA TTACTTGAAG GGCCAGTGCA 840 

GCAACTGCGC AGTTGTGCAG CTCTTAACCC AGCCACATTT CTTCCAGACA ATGAAGATAG 900 

AACATAACTG CCAACAAGTA ATTTCTCAAA CCTAGGCCGC TCGAGGGAAC CTTTTAGAGG 9 60 

20 

TTCCCTTAAC TGATCCCGAC CTCAACTTGT ATACTGATGG AAGTTCCTTT GTAGAAAAAG 1020 

GACTTTGAAA AGTGGGGTAT GCAGTGCTCA GTGATAATGG AATACTTGAA AATAATCCCT 1080 

2 5 TCATTCCAGG AACCAGCGTT CAGCTGGCAG AATTAATAGC CCTCACTCGG GCATTAGAAT 1140 

TAGGAGAAGG AAAAAGGGTA AATACACATA CAGATTCTAA GTATGTTTAC TTAGTCCTCC 1200 

GTGCCCACGC AGCAATATGG AGAGAAAGGG AATGCTTAAC TTCTGAGGGA ACACCTATCA 1260 

30 

AACATCAGGA AGTTATTAGG AGATTATTAT TGGCTATACA GAAACCTAAA GAGGTGGCAG 1320 

TCTTACACTG CTGGGGTGGT CAGAAAGAAA AGGAAAGGGA AATAAAAGGG AACTGCCAAG 1380 

3 5 CGGATATTGA AGCCAAAAGA GCCGCAAGGC AGGACCCTCC ATTAGAAATG CTTATAGAAG 1440 
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GACCCCTAGT ATGGGGTAAT CCCCTCCGGG AAACCAAGCC CCAATACTTA GAAAAAGAAA 1500 
TAGAATGGGG AACCTCACGA GGACATAGTT TCCTCCCCTC AGGATGGCTA GCCACCGAAG 1560 
AAGGAAAAAT ACTTTTGCCT GCAGCTAACC AATGGAAATT ACTTAAAACC CTTCACCAAA 1620 
CCTTTCACTT AGACATTGAT AGCACCCATC AGATGGCCAA ATCATTATTT ACTGGACCAG 1680 
GCCTTTTCAA AACTATCAAG CAGCTAGTCA GGGCCTGTGA AGTGTGCCGA AGAAATAATC 17 40 
CCATGCCTTA TCACCAAGCT CCTTCAGGAG AACAAAGAAC AGGCCATTAC CCAGGAGAAG 1800 
RVTGGCAACT AGATTTTACC CACATGCCCA AATCTCAGGG ATTTCAGTAT CTACTAGTTT 18 60 
GGGTAGATAC TTTCACTGGT TGGGCAGAGA CCTTCCCCTG TAAGACAGAA AAGTCCCAAG 1920 
AGGTAATAAA GGCATTAGTT CATGAAATAA TTCCCAGATT CAGACTTCCC TGAGGCTTAC 1980 
AGAGTGACAA TGGCCCTGCT TTCAAGGCTA CAGTAACCCA GGAGTATCCC AGGTGTTAGG 2040 
TATACAATAT CACTTACACT GCGCCTGGAG GCAGTCCTCA GGGAAGGCCG AGAAACTGAA 2100 
TGAAACACTC AAACGACATC TAAAAAAAGC TAACCCAGGA AAACCACCTC ACATGGCCTG 2160 
CTCTGTTGCC TATAGCCTTA CTAAGAATCC AAAACTCTCC CCAAAAAGCA GGACTTAGCC 2220 
CATACGAAAT GCTATATGGA TAGCCCTTCC TAACCAATGA CCTTGTGCTT GACTGAGAGA 2280 
GAGCCAACTT AGTTGCAGAC ATCACCTCCT TATCCAAATA TCAACAAGTT CTTAAAACAT 2340 
TACAAGGAGC CTGTCCCCGA GAAGAGGGGA AGGAACTATT CCACCCTGGT GACATGGTAT 2400 
TAGTCAAGTC CCTTCCCTCT AATTCTCATT GCCTAGATAT ATCCTGGGAA GGACCCTACC 2460 
CAGTCATTTT ATCTACCCCA ACCGCAGTAA AAGTGGCTGG AGTGGAGTCT TGGATACATC 2 520 
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ACACTCGAGT CAAACCCTGG ATATTACCAA AGGAACCTGA AAATCCAGGA GACAA 2 57 5 

(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 783 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 



TGAGAGACAG 


GACTAGCTGG 


ATTTCCTAGG 


CYGACTAAGA 


ATCCYTAAGC 


CTAGSTGGGA 


60 


AGGTGACCAC 


RTCCACCTTT 


AAACACGGGG 


CTTGCAACTT 


AGYTCACACC 


TGACCAATCA 


120 


GAGAGCTCAC 


TAAAATGCTA 


ATTAGGCAAA 


GACAGGAGGT 


AAAGAAATAG 


CCAATCATYT 


180 


ATTGCMTGAG 


AGCACAGCAG 


GAGGGACAAY 


RATCGGGATA 


TAAACCCARG 


YHTTCGAGCY 


240 


GGCAACRGCA 


GMCCCCCTTT 


GGGTCCCYTC 


CCTTTGTATG 


GGAGCTCTGT 


TTTCATGCTA 


300 


TTTCACTCTA 


TTAAATCTTG 


CARCTGCRCT 


CTTCTGGTCC 


ATGTTTCTTA 


CGGCTYGAGC 


360 


TGAGCTTTYG 


CTCRCCRTCC 


ACCACTGCTG 


TTTGCCRCCA 


CCGCANACCY 


GCCGCTGACT 


420 


CCCATCCCTC 


TGGATCMTGC 


AGGGTGTCCG 


CTGTGCTCCT 


GATCCAGCGA 


RGCRCCCATT 


480 


GCCGCTCCCA 


ATYGGGCTAA 


AGGCTTGCCA 


TTGTNCCTGC 


AYGGCTAAGT 


GCCTGGGTTY 


540 


RTYCTAATTG 


AG CTG AACAC 


TANTCACTGG 


GTTCCATGGT 


TCTCTTCTGT 


GACCCACRGC 


600 


TTCTAATAGA 


RCTATAACAC 


TYACCRCATG 


GCCCAAGRTT 


CCATTCCTTG 


GAATCCRTRA 


660 


RGSCAACGAA 


CYCCASGTCA 


GAGAAYACGA 


RGCTTGCCAC 


CATCTTGGAA 


GCGGCCTGCT 


720 


ACCATCTTGG 


AAGTGGTTCA 


CCACCATCTT 


GGGAGCTCTG 


TGAGCAAGGA 


CCCCCMRGTR 


780 


ACA 












783 



(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

5 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 
10 (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 16: 

TGTCCGCTGT GCTCCTGATC 2 0 



15 (2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

20 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

2 5 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

ATGCACTCTG GCTGGGCCAA T 21 

30 

(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
35 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 
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5 



(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 
10 ACCATTTGAC CCTCAGACAC T 21 

(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

20 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

AACCCTTTGC CACTACATCA ATTT 24 



3 0 (2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 

5 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 20: 
TCAGGGATAG CCCCCATCTA T 21 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 22 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

20 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
2 5 TTGTCTCCTG GATTTTCAGG TT 22 



(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

3 0 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

35 

(ii) TYPE DE MOLECULE: ADN 
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(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 22: 

5 

GGACCCTACC CAGTCATTTT 20 



(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

10 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
15 (D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
ATCAGGAGCA CAGCGGACAC 20 



20 



25 

(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 22 paires de bases 
3 0 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



35 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GGACATCCAA AGTGATACAT CC 2 2 

5 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 
10 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
<D) CONFIGURATION: lineaire 

15 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 

20 

AATGTATGGC CTGAAGTGCA G 21 



(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

25 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
30 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

35 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26; 
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CTTCCCAGGA TGTATCACTT TG 22 

5 (2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

10 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

15 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: 

CACTGCAGAA GAATATAAGT CGTT 24 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 0 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
35 GCTTCCAAGA TGGTGGCAAG C 21 
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(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 678 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

10 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 

15 

TCAGGGATAG CCCCCATCTA TTTGGCCAGG CATTAGCCCA AGACTTGAGC CAGTTCTCAT 60 

ACCTGGATAT TCTTGTCCTT TGGTATGCGG ATGATTTACT TTTAGCCGCC CGTTCAGAAA 120 

2 0 CCTTGTGCCA TCAAGCCACC CAAGTGCTCT TAAATTTCCT CGCCACCTGT GGCTACAAGG 180 

TTTCCAAACC AAAGGCTCAG CTCTGCTCAC AGCAGAAGGC TATTTACCCT AAATACTTAG 240 

GGCTGAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ATGTATCCAG CCTATACTGG 300 

25 

CTTATCCTTA TCCCAAAACC CTAAAACAAC TAAGAAGGTT CCTTGGCATA ATAGGCATAA 360 

CAGGCATAAC AGGTTTCTGC TGAATATGGA TTCCCAAGTA CGGCAAAATA GCCAGACCAT 420 

3 0 TATATACACT AATTAAGGAA ACTCAGAAAG CCAATACCCA TTTAGTAAGA TGGACACCTG 480 

AAGCAGAGGC AGCTTTCCAG GCCGTAAAGA ACACCCTAAC CCAAGCCCCA GTGTTAAGCT 540 

TGCCAGCGGG GCAAGACTTT TCTTTCTGTG TCACAGAAAA AATAGGAATA GCTNTAGGAG 600 

TCCTTACACA GGTCCGAGGG ACCAGCTTGC AACCCATGGC ATACCTGAGT AAGGAAATTG 660 

FEUILLE DE REPLACEMENT (REGLE 26) 



35 



BNS0OCID- <WO 9902696A1> 



WO 99/02696 



PCT/FR98/01442 



45 



ATGTAGTGGC AAAGGGTT 



678 



5 (2) INFORMATIONS POUR LA SEQ ID NO: 30: 



10 



(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 536 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN 



15 (iii) HYPOTHETIQUE: NON 



20 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 



CCAATCTCCA TGTTGTATCC CCTTCCCCAA CTAATAAGGA CCCCCCTTTC AACCCAAACA 60 



GTCCAAAAGG ACATAGACAA AGGAGTAAAC AATGAACCAA AGAGTGCCAA TATTCCCTGG 120 



TTATGCACCC TCCAAGCGGT GGGAGAAGAA TTCGGCCCAG CCAGAGTGCA TGTACCTTTT 180 



2 5 TCTCTCTCAC ACTTGAAGCA AATTAAAATA GACCTAGGTA AATTCTCAGA TAGCCCTGAT 240 



GGCTATATTG ATGTTTTACA AGGATTAGGA CAATCCTTTG ATCTGACATG GAGAGATATA 300 



30 



ATATTACTGC TAAATCAGAC GCTAACCTCA AATGAGAGAA GTGCTGCCAT AACTGGAGCC 360 



CGAGAGTTTG GCAATCTCTG GTATCTCAGT CAGGTCAATG ATAGGATGAC AACGGAGGAA 42 0 



AGAGAACGAT TCCCCACAGG GCAGCAGGCA GTTCCCAGTG TAGCTCCTCA TTGGGACACA 480 



35 GAATCAGAAC ATGGAGATTG GTGCCGCAGA CATTTAAAGC TTTCCCCGGG TACCGA 536 
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(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 
5 (A) LONGUEUR: 591 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

10 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE : NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 

15 

CCATGGCCAT CTACACTGAA CAAGATTTAT ACAATCATGT CGTACCTAAG CCCCACAACA 60 
AAAGAGTACC CATTCTTCCT TTTGTTATCA GAGCAGGAGT GCTAGGCAGA CTAGGTACTG 120 
2 0 GCATTGGCAG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAAATAAATG 180 
GTGACATGGA ACAGGTCACT GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 240 
CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTTGCT AACCGCCAAA AGAGGGGGAA 300 

25 

CCTGTTTATT TTTAGGAGAA GAACGCTGTT ATTATGTTAA TCAATCCAGA ATTGTCACTG 360 
AGAAAGTTAA AGAAATTCGA GATCGAATAC AATGTAGAGC AGAGGAGCTT CAAAACACCG 420 
3-0 AACGCTGGGG CCTCCTCAGC CAATGGATGC CCTGGGTTCT CCCCTTCTTA GGACCTCTAG 480 
CAGCTCTAAT ATTGTTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAAGTTTG 540 
TCTCTTCCAG AATTGAAGCT GTAAAGCTAC AGATGGTCTT ACAAATCTAG A 591 

35 
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(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 364 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 
(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 32: 



15 CTAACCTGAG GATCCAGCAG CAGGACTGAG GGTGCCCGGG GCAAGTGCCA GCCCATGCCA 60 



TCACCCTCAG AGCCCCGGGT ATGTTTGACC ATTGAGAGCC AGGAAGTTAA CTGTCTCCTG 120 



GACACTGGCG CAGCCTTCTC AGTCTTACTT TCCTGTCCCA GACAATTGTC CTCCAGATCT 180 

20 

GTCACTATCC GAGGGGTCCT AGGACAGCCA GTCACTACAT ACTTCTCTCA GCCACTAAGT 240 



TGTGACTGGG GAACTTTACT CTTTTCACAT GCTTTTCTAA TTATGCCTGA AAGCCCCACT 300 



25 CCCTTGTTAG GGAGAGACAT TTTAGCAAAA GCAGGGGCCA TTATACACCT GAACAAGCTT 360 



GAAA 



364 



30 (2) INFORMATIONS POUR LA SEQ ID NO: 33: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 538 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: proteine 

(iii) HYPOTHETIQUE : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

Met Gly Leu Pro Tyr His lie Phe Leu Cys Ser Val Leu Ser Pro Cys 
15 10 15 

Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser Ser Ser 
20 25 30 



Pro His Pro Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn lie Asp 
15 35 40 45 

Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe Thr Ala 
50 55 60 

20 His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu Cys Met 

65 70 75 80 

His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro Ser Cys 
85 90 95 

25 

Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr Gin Thr 
100 105 110 

Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu Lys His 
30 115 120 125 

Val Lys Glu Val lie Ser Gin Leu Thr Gly Val His Gly Thr Ser Ser 
130 135 140 

3 5 Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu Arg Thr 

145 150 155 160 
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His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly Leu His 
165 170 175 

Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu Pro Leu 
180 185 190 

Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp Asn Asn 
195 200 205 

Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro Leu Val 
210 215 220 



Ser Asn Val Glu lie Thr His Thr Ser Asn Leu Thr Cys Val Lys Phe 
15 225 230 235 240 

Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys lie Arg Trp Val Thr 
245 250 255 

20 Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly lie Phe Phe Val Cys 

260 265 270 

Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser Met Cys 
275 280 285 

25 

Phe Leu Ser Phe Leu Val Pro Pro Met Thr lie Tyr Thr Glu Gin Asp 
290 295 300 

Leu Tyr Ser Tyr Val lie Ser Lys Pro Arg Asn Lys Arg Val Pro lie 
30 305 310 315 320 

Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly Thr Gly 
325 330 335 

35 He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu Ser Gin 

340 345 350 
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Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
355 360 365 

Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Arg Asn Arg Arg 
370 375 380 

Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu Phe Leu 
385 390 395 400 

Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly lie Val Thr Glu 
405 410 415 



Lys Val Glu Glu lie Pro Asp Arg lie Gin Arg lie Ala Glu Glu Leu 
15 420 425 430 

Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Arg Trp Met Pro Trp lie 
435 440 445 

20 Leu Pro Phe Leu Gly Pro Leu Ala Ala lie lie Leu Leu Leu Leu Phe 

450 455 460 

Gly Pro Cys He Phe Asp Leu Leu Val Asn Phe Val Ser Ser Arg He 
465 470 475 480 

25 

Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys Thr Lys 
485 490 495 

He Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser Asp Val 
30 500 505 510 

Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala Gin Pro 
515 520 525 

3 5 Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 

530 535 
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(2) INFORMATIONS POUR LA SEQ ID NO: 34: 

5 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 52 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

10 

(ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE : NON 

15 (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 34: 

Met Glu Pro Lys Met Gin Ser Lys Thr Lys lie Tyr Arg Arg Pro Leu 
15 10 15 

20 Asp Arg Pro Ala Ser Pro Arg Ser Asp Val Asn Asp lie Lys Gly Thr 

20 25 30 



25 



Pro Pro Glu Glu lie Ser Ala Ala Gin Pro Leu Leu Arg Pro Asn Ser 
35 40 45 

Ala Gly Ser Ser 
50 



3 0 (2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 48 acides amines 
<B) TYPE: acide amine 
35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: peptide 

(iii) HYPOTHETIQUE : NON 

5 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 

Met Leu Met Thr Ser Lys Ala Pro Leu Leu Arg Lys Ser Gin Leu His 
15 10 15 

10 

Asn Leu Tyr Tyr Ala Pro lie Gin Gin Glu Ala Val Arg Ala Val Val 
20 25 30 

Gly Gin Pro Pro Gin Gin His Leu Gly Phe Pro Val Glu Met Gly Asp 
15 35 40 45 
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